سؤال

لقد كنت تبحث في البحث عن الإضافات / الأحجار الكريمة للقضبان. معظم المقالات تقارن من Ferret (لوسن) إلى UltraSphinx أو ربما التفكير أبو الهول، ولكن لا شيء يتحدث عنه searchlogic.. وبعد هل لدى أي شخص أي أدلة حول كيفية مقارنة ذلك؟ ماذا تستخدم، وكيف تؤدي؟

هل كانت مفيدة؟

المحلول

  • thinke_sphinx و sphinx يعمل بشكل جميل، لا الفهرسة، الاستعلام، تثبيت المشاكل من أي وقت مضى (5 أو 6 تثبيت، بما في ذلك الإنتاج Slicehost)

  • لماذا لا يستخدم الجميع أبو الهول، مثل، قل كريغزلست؟ اقرأ هنا عن قيودها (السنة والمقالات القديمة نصف. يعمل مطور أبو الهول، Aksyonoff، على هذه وتضع ميزات وموثوقية وختم الأخطاء في وتيرة مذهلة)

http://codemonkey.ravelry.com/2008/01/09/sphinx-for-search/

http://www.ibm.com/developerworks/opensource/library/os-php-apachesolr/

مقارنة بمحرك البحث النص الكامل - لوسن، أبو الهول، postgresql، Mysql؟

  • النمس: سهل التركيب، لا ينبع بشكل صحيح، فهرسة بطيئة جدا (واحد mysql db: sphinx: 3 ثوان، النمس: 50 دقيقة). مشاكل موثقة جيدا (الفساد الفهرس) في خوادم DRB في الإنتاج قيد التحميل. بعد القول أنه، استخدمته في develometn منذ أن خرج Acts-AS_FERRET منذ 3 سنوات، وقد خدمني جيدا. عدم الالتزام بالبورتر ستيمنغ ميزة في بعض السياقات.

  • Lucene و Solr هي شاحنة الغوريلا / ماك / البطل الثقيل للبحث عن المصدر المفتوح. تقوم الفرق بعدد مثير للإعجاب من الميزات الجديدة في Solr 14 الإفراج:

  • Acts-as-solr: يعمل بشكل جيد، بمجرد وجود Tomcat أو Jetty، لكن هؤلاء في بعض الأحيان هم ألم. ال AAS شوكة من مات إم هو الشوكة الرئيسية، لكن المشروع غير مخلص نسبيا.

  • إعادة تثبيت Tomcat: Solr / Lucene لديه بلا شك أفضل محرك بحث / دعم قاعدة المعرفة لأي حزمة برامج رأيته (أعتقد أنني لست مفاجأة)، والبحث هنا:

http://www.lucidimagination.com/

  • Sunspot الجديد غلاف روبي، بناء على سولر روبي. يبدو واعدا، لكنني لم أستطع الحصول عليها لتثبيت OSX. فهرسة جميع كائنات روبي، وليس فقط قواعد البيانات من خلال AR

  • هناك شيء واحد مفيد حقا هو تثبيت مكونات البحث 2، مثل أبو الهول و Solr و Solr و SPHINX و FERET، ونرى ما هي النتائج المختلفة التي يعودونها. انها سهلة كما @sphinx_results - @ferret_results


فقط رأيت هذا المنصب والردود

http://zooie.wordpress.com/2009/07/06/a-comparison-of-open-source-search-engines-and-indexing-twitter/

http://www.jroller.com/otis/entry/open_source_search_engine_benchmark.

http://www.flax.co.uk/blog/2009/07/07/xapian-compared/

نصائح أخرى

أولا قبالة، التحيز واضحة بلدي: لقد أنشأت والحفاظ على التفكير أبو الهول.

كما يحدث ذلك، رأيت فعلا بن جونسون (خالق Searchlogic) موجود في NYC Ruby مقابلته الليلة الماضية. SearchLogic هو SQL فقط - لذلك إذا كنت لا تتعامل مع الجداول الضخمة، فإن التصنيف الأهمية ليست حاجة إليها، ثم قد يكون بالضبط ما تبحث عنه. بناء الجملة نظيفة جدا، أيضا.

ومع ذلك، إذا كنت تريد أن يتم التعامل مع كل الذكاء الاستعلام بواسطة الرمز غير المشترك الخاص بك ليس بنفسك، فإن أبو الهول أو سولل سولل (وهو لوسن تحت غطاء محرك السيارة، وأعتقد أنه) من المحتمل أن يعمل بشكل أفضل.

Searchlogic هو مساعد جيد، ولكن المقصود حقا لجعل رمز البحث الخاص بك أكثر قابلية للقراءة، لا يوفر الفهرسة التلقائية التي يقوم بها أبو الهول. لم أستخدم النمس، لكن أبو الهول قوية بشكل لا يصدق.

http://railscasts.com/episodes/120-thinking-sphinx.

مقدمة رائعة لمعرفة مدى مرونة.

لم أستخدم SearchLogic ولكن يمكنني أن أخبرك أن Lucene هو مشروع ناضج للغاية، لديه تطبيق في العديد من اللغات. إنه سريع ومرن و API ممتع للعمل معه. إنه رهان جيد.

بالنظر إلى هذا السؤال مرتبة عالية في Google بحثا عن النص الكامل، أود حقا أن أقول ذلك Sunspot. هو أقوى اليوم إذا كنت مهتما بإضافة قدرات البحث النص الكامل إلى تطبيق القضبان الخاصة بك (وأود أن يكون لديك سولقل خلفك لذلك). يمكنك التحقق من البرنامج التعليمي الكامل على هذا هنا.

وبينما نحن في ذلك، منافس آخر وصل إلى هذا المجال هو Elasticsearch., ، يهدف إلى أن يكون محرك بحث نصي كامل في الوقت الفعلي الذي تم بناؤه على رأس لوسين (ولكن يفعل الأمور بشكل مختلف بالمقارنة مع Solr). يحتوي Elasticsearch على شاردينغ خارج الصندوق وتكرار النسخ المتماثل إلى العقد المتعددة، والبحث في الوقت الفعلي الأسرع، "Percolators" للسماح لك تلقي الإخطارات عندما يتوفر شيء يتطابق مع معاييرك وتتحرك بسرعة كبيرة مع العديد من الميزات الأخرى. من السهل بناء شيء ما فوقه، نظرا لأن API ميت بسيطة ومقرها بالكامل على الراحة باستخدام JSON كنسيق. يمكن للمرء أن يقول أنك لا تحتاج حتى إلى مكون إضافي لاستخدامه.

شخصيا، أنا لا أزعج مع قاعدة البيانات لعملية قاعدة البيانات لتطبيقات الويب وأنا سعيد للغاية باستخدام البحث النص الكامل في PG83. الفائدة هي، إذا قمت بتغيير إطار / لغتك، فستظل لديها بحث نصي كامل.

لأي شخص يبحث عن جوهرة بحث بسيطة دون أي تبعيات، تحقق من acts_as_indexed.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top