سؤال

هل هناك أي تطبيق مفتوح المصدر من LSI في جافا؟ أريد أن استخدام هذه المكتبة لمشروعي. لقد رأيت jLSI ولكنه ينفذ بعض نموذج آخر من LSI. أريد نموذج قياسي.

هل كانت مفيدة؟

المحلول

هل تعتبر (تخصيص الكامنة ديريتشليت) LDA؟ ليس لدي أي حقا، ولكن أنا واجهت نفس المشكلة مع LSI مؤخرا (براءات الاختراع). من ما أفهم LDA هو ذات الصلة / تقنية أكثر قوة. http://en.wikipedia.org/wiki/Latent_Dirichlet_allocation على ما يبدو لديها بعض الروابط لالمفتوح تطبيقات المصدر.

نصائح أخرى

وجوجل للبحث عن الفرص LSI جافا ل ل سؤال مماثل أن توصي SemanticVectors. حزمة بنيت على رأس لوسين الذي هو "مماثلة" لLSI. أنا لا أعرف ما اذا كان أقرب من تنفيذ jLSI.

ويذكر أن موضوع أيضا أن LSI على براءة اختراع وليس هناك الكثير من تطبيقات منه. حتى إذا كنت في حاجة الى تنفيذ القياسية قد تضطر إلى استخدام لغة أخرى من جافا.

S-الفضاء لديه نسخة مفتوحة المصدر من LSA ، مع ربط للناقلات وثيقة LSI. (كلا النهجين تعمل على نفس المستند مصطلح المصفوفة وتعادل إلا في الإخراج.) إنها مقاربة متدرجة إلى حد ما يستخدم رقيقة SVD. كنت استخدمه لتشغيل LSI على كل من ويكيبيديا مع أي قضية (بعد إزالة شروط نادرة مع أقل من 5 تكرارات).

وكما ذكر سكوت راي، وSemanticVectors حزمة أيضا لديه تنفيذ LSI الخير الذي تحول مؤخرا إلى استخدام نفس رقيقة SVD (SVDLIBJ)، لذلك قد التحقق من ذلك كما لو كان لديك ليس قبل ذلك.

وجوجل للبحث عن أدوات NLP توفر هذه الشرائح الذي أعتقد أنه يساعد على ...

وأعتقد أن LSA / LSI كان على براءة اختراع في عام 1989، وهو ما يعني يجب أن يكون على براءة اختراع فقط منتهية الصلاحية. نأمل أن نرى بعض لطيفة التطبيقات مفتوحة المصدر قريبا.

هل حاول حزمة الدلالية المتجهات؟

http://code.google.com/p/semanticvectors/

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top