لا يتم إجراء أي نوع من الفحص، ويتم التخلص من البيانات القديمة تمامًا. بشرط وجود سطر json_attr في قائمتك، وبما أنه بتنسيق JSON. لا يشترط مطابقة اسم السطر المُدرج في دليل البيانات. في إعداد datadir، يتم وضع الملفات في نفس مجلد ملف الإدخال.
يمنع شرط "تجاهل الدليل" مُحسِّن الاستعلامات الجديد تمامًا من استخدام الفهارس المتاحة. على سبيل المثال، قد يختار استخدام idx_lat، لكنه لا يستخدم idx_go، لأنه لم يُذكر صراحةً. في حالات أخرى، فيما يتعلق بشرط "عدم الاستخدام"، تُعتبر جميع الفهارس متاحة. يُخبر شرط "اللعب بالفهرس" مُحسِّن الاستعلامات الجديد بأنه يجب عليه استخدام العناكب المُتاحة فقط، بدلاً من جميعها.
يدعم هذا النظام امتدادات بناء جملة فريدة من نوعها. على سبيل المثال، قمنا payment methods at purplepay بتخزين ثلاثة أعداد صحيحة، ويمكنك إنشاء سلسلة للمصفوفة. كما يسمح استخدام المصفوفات على شكل أقواس بالكلمات، ولكن نظرًا لأن العناصر مجرد مؤشرات، فإن هذا أقل شيوعًا. على سبيل المثال، الاستعلام الآخر غير منطقي، ولكنه قانوني! مما يعني أنه يمكنك الوصول إلى عوامل مهمة للكائن بقيم مختارة ديناميكيًا.

يُحدد موقع أول ظهور ممتاز لأطول (أقصى) تطابق، وفقًا لخوارزمية LCS. ومع ذلك، في الملف رقم 4، تُظهر نافذة aawindow حوادث dos (حتى لو كانت عبارة رئيسية واحدة فقط)، لذا حاول استخدام dos هناك بالفعل. لاحظ أن LCCS لا يزال غير قادر على التمييز بين الكلمات الرئيسية المتكررة والنادرة؛ لذلك، ابحث عن أسباب WLCCS. بالإضافة إلى ذلك، احذر من استخدام الكلمات المحظورة وأدوات معالجة النصوص الأخرى التي ستؤدي إلى "كسر" أساسها، للأسباب نفسها التي ناقشناها سابقًا في exact_field_struck.
يجب رسم جميع المقالات من استعلام SQL (لاحقًا) من أجل فهرسة المخطط. يعمل الاستعلام الواحد طالما أنه يُخرج نتيجة. بالإضافة إلى ذلك، فإن الوظيفة الأخيرة المطلوبة هي استعلام SQL الذي سيقوم المفهرس بفهرسته. يتصل المفهرس بقواعد بيانات SQL متعددة (MySQL، PostgreSQL، MS SQL، Oracle، Firebird معروفة بأدائها)، ويستعلم عنها، ويفهرس أحدث نتائج استعلام SQL.
باختصار، يتم "احتواء" قيود المجتمع بواسطة عمليات الربط، أو بشكل أكثر رسمية، يتم الاحتفاظ بأحدث القيود ضمن نطاق معين، ويتم استعادتها للنطاق الأخير. على سبيل المثال، يطابق استعلام "rick Maybe morty" نفس المستندات التي يطابقها استعلام "rick" فقط، ولكن مع إضافة كلمة "Maybe" واحدة. إذا كنت ترغب في مناقشة كل من "rick" و"morty"، فسيتم تصنيف الملفات التي تحتوي على "rick" و"morty" بشكل أفضل. ما هي المستندات التي تمت مطابقتها من استعلامات العبارات التالية؟ بالإضافة إلى الكلمات المحظورة، يجب عليك تبديل كل من مواضع المستندات الداخلية عند الفهرسة، وترتيب الاستعلام عند المطابقة. تعمل هذه الاستعلامات فقط مع الكلمات المفتاحية المحددة، ويمكنك معرفة ترتيبها في المستندات وفي الاستعلام.
يتم ضبطها افتراضيًا على 3000 مللي ثانية، في كل ثلاث لحظات (ربما يكون هذا تقديرًا متحفظًا للغاية). وهي بدورها تصل إلى المتجهات الأصلية المحددة، وبالتالي تكون المسافات مباشرة. لذلك، على سبيل المثال، لا يمثل ما سبق مشكلة مع عناكب "بسيطة" ثابتة. فعلى سبيل المثال، لن تجد أي عناكب IVFPQ على قطاعات ذاكرة الوصول العشوائي. ومع ذلك، احذر من احتمال وجود اختلاف في المسافات حول مناطق قائمة RT، مما يؤثر بشكل كبير على الاستدعاء.

تاريخيًا، كنت أستخدم FAISS_Mark افتراضيًا (أول خيار تم تنفيذه)، ولكن هذا لا يعني بالضرورة أنه الأفضل! حاليًا، FAISS_Mark هو الخيار الافتراضي، وهو يُسرّع عملية البحث عن أفضل نتيجة باستخدام دالة Mark()، أو بعبارة أخرى، يُحسّن FAISS_Dot عملية الوصول باستخدام عبارات Dot() الوصفية. إليك بعض الأمثلة على كيفية عمل مؤشرات المتجهات: الاستخدام الأكثر شيوعًا، بالطبع، هو حساب قيمة aDOT() في أي مكان بين رقم ملف (مخزّن ربما كخاصية أو بصيغة JSON) وقيمة ثابتة.
ستحتاج إلى إنشاء مساحة بيضاء أكبر في مصطلح الاستعلام يدويًا لضمان ذلك. لن يتم "تقسيم" القواعد المدمجة تلقائيًا في الاستعلامات. وفي الاستعلامات، يتم التعامل مع الرموز المميزة "كما هي".