مخطط قابل للتوسيع لبناء مجموعات دلالية كبيرة ذات علامات ضعيفة
في البرمجة اللغوية العصبية، تقود البيانات البحث، كما يتضح من وتيرة استخدام الأعمال الأساسية لهندسة قواعد البيانات مثل The Penn Treebank كأساس للتجريب. تعد المجموعات المشروحة بخبرة واسعة النطاق تقليديًا باهظة الثمن وتستغرق وقتًا طويلاً في الإنتاج. دفع هذا النموذج الباحثين إلى اعتماد أساليب آلية لتوليد البيانات المصنفة باستخدام الأدوات المتاحة مثل Freebase وDBpedia و"صناديق المعلومات" الموجودة على صفحات ويكيبيديا. تم إدراج قواعد المعرفة هذه، أو هي في طور الدمج، في ويكي بيانات، وهي مبادرة لتركيز مستودعات البيانات المتباينة في تنسيق منظم يمكن قراءته آليًا. هذا المورد هو أداة بحث مهمة. في هذه الورقة، نراجع تجربتنا في استخدام ويكي بيانات في إنشاء مجموعة كبيرة مشروحة تحت إشراف بعيد، علاوة على ذلك، نجعل المواد، والكود المستخدم لإنشاء تعليقاتنا التوضيحية، متاحة مجانًا لجميع الأطراف المعنية.
