باحثون يثبتون إمكانية تدريب نماذج ذكاء اصطناعي دون انتهاك حقوق النشر، خلافًا لما تدّعيه الشركات الكبرى

باحثون ينجحون في تجميع قاعدة بيانات ضخمة بحجم 8 تيرابايت من النصوص المتاحة بحرية

0 127 دقيقة واحدة

في الوقت الذي تدّعي فيه كبرى شركات الذكاء الاصطناعي أن احترام حقوق النشر أمر غير عملي لتطوير النماذج اللغوية الضخمة، أظهر فريق من الباحثين أن بناء نموذج قوي باستخدام بيانات مرخصة أو ضمن الملكية العامة ممكن، وإن كان شاقًا ومعقدًا.

نموذج “Comma v0.1”: دليل عملي على تدريب الذكاء الاصطناعي ببيانات قانونية

أكثر من عشرين باحثًا من مؤسسات أكاديمية ومراكز بحثية مرموقة، من بينها MIT وجامعة تورنتو ومعهد ألين للذكاء

الاصطناعي، نجحوا في تجميع قاعدة بيانات ضخمة بحجم 8 تيرابايت من النصوص المتاحة بحرية. باستخدام هذه البيانات،

درّبوا نموذجًا لغويًا يحتوي على 7 مليارات مُعامل، وحقق نتائج مقاربة لنموذج LLaMA 2 الذي أطلقته شركة ميتا في عام 2023. هذا النموذج الجديد، الذي أطلق عليه اسم Comma v0.1، يستند إلى قاعدة بيانات تسمى Common Pile v0.1، وتتضمن مصادر نصية مثل مكتبة الكونغرس الأميركية التي وفّرت نحو 130 ألف كتاب باللغة الإنجليزية، وهي ضعف ما يتيحه مشروع غوتنبرغ الشهير.

تحديات بناء قاعدة بيانات مرخصة: جهد يدوي مكثف

الباحثون أوضحوا أن العملية استغرقت جهدًا هائلًا، ولا يمكن أتمتتها بالكامل، إذ تطلب الأمر تدقيقًا يدويًا للتحقق من تراخيص المحتوى والتأكد من صلاحيته القانونية للاستخدام. وأكدوا أن الاعتماد على أدوات تقنية فقط غير كافٍ في بيئة مليئة بالبيانات

التي تفتقر إلى وضوح قانوني أو تُستخدم دون إذن. ويأمل الفريق في توسيع هذا النهج تدريجيًا لبناء نماذج أكبر وأكثر قدرة، دون انتهاك الحقوق.

تصاعد الجدل القانوني حول حقوق النشر والذكاء الاصطناعي عالميًا

هذا التطور يأتي في ظل تصاعد الجدل القانوني حول استخدام المحتوى المحمي في تدريب الذكاء الاصطناعي. مؤخرًا، رفعت منصة Reddit دعوى قضائية ضد شركة Anthropic بدعوى استخدام بياناتها دون ترخيص. في الوقت نفسه، تشهد المملكة المتحدة مناقشات حادة حول مشروع قانون قد يسمح باستخدام المحتوى المحمي لهذا الغرض.

وفي الولايات المتحدة، تزايد الجدل بعد قرار الرئيس دونالد ترامب إقالة مديرة مكتب حقوق النشر، وهو ما سلط الضوء مجددًا على تقرير المكتب الأخير، الذي أبدى تحفظات كبيرة حول اعتبار استخدام المحتوى المحمي “استخدامًا عادلًا” في تدريب النماذج التوليدية.

دعوات لشفافية بيانات شركات الذكاء الاصطناعي الكبرى

رغم أن الباحثين لا يتوقعون أن تتبنى الشركات الكبرى هذا النهج الشاق، إلا أنهم يأملون أن تعود هذه الشركات إلى قدر من الشفافية حول مصادر بياناتها، كما كانت تفعل في بدايات العقد، ما قد يعزز الثقة العامة والعلمية في هذه التكنولوجيا سريعة التطور.

الوسوم

إيمان زريقاتمنذ 4 ساعات

0 127 دقيقة واحدة

باحثون يثبتون إمكانية تدريب نماذج ذكاء اصطناعي دون انتهاك حقوق النشر، خلافًا لما تدّعيه الشركات الكبرى

باحثون ينجحون في تجميع قاعدة بيانات ضخمة بحجم 8 تيرابايت من النصوص المتاحة بحرية

نموذج “Comma v0.1”: دليل عملي على تدريب الذكاء الاصطناعي ببيانات قانونية

تحديات بناء قاعدة بيانات مرخصة: جهد يدوي مكثف

تصاعد الجدل القانوني حول حقوق النشر والذكاء الاصطناعي عالميًا

دعوات لشفافية بيانات شركات الذكاء الاصطناعي الكبرى

إيمان زريقات

اترك تعليقاً إلغاء الرد

إقالة مدير وكالة الأمن القومي تثير تحذيرات من الديمقراطيين: الأمن الأمريكي في خطر

موقف أوربان من أوكرانيا يدفع المجر إلى حافة القطيعة مع الاتحاد الأوروبي

الأمير هاري يطلب المصالحة والملك يرفض الحديث بسبب الخلاف الأمني الحالي.

الصراع بين الهند وباكستان” تصعيد ينذر بالخطر:ماعلاقة الجماعات الدينية_خاص

كيف سيطر أنصار ترامب على وزارة الخارجية الأمريكية بتعيينات مثيرة للجدل

ترامب يقرر فرض غرامات مالية على كل من يرفض الرحيل من البلاد

نموذج “Comma v0.1”: دليل عملي على تدريب الذكاء الاصطناعي ببيانات قانونية

تحديات بناء قاعدة بيانات مرخصة: جهد يدوي مكثف

تصاعد الجدل القانوني حول حقوق النشر والذكاء الاصطناعي عالميًا

دعوات لشفافية بيانات شركات الذكاء الاصطناعي الكبرى

إيمان زريقات

كل ما تريد معرفته عن فيلم السادة الأفاضل لمحمد ممدوح

على طريقة عمر وسلمى.. تامر حسني يعلق على فيديو سكب المياه

مقالات ذات صلة

أستراليا تنقل فيلة حدائق الحيوان إلى محميات واسعة: خطوة نحو رفاهية أفضل

كيف يُعيد الذكاء الاصطناعي إنتاج كراهية النساء بأدوات تقنية معاصرة وصامتة؟

بين الإنسان والآلة: رؤيتي لمستقبل تتحكم فيه الخوارزميات

رامي عاشور قدوة الشباب في العصر الرقمي.. خطوات مدروسة ونجاح لا يُوقف

اترك تعليقاً إلغاء الرد

إقالة مدير وكالة الأمن القومي تثير تحذيرات من الديمقراطيين: الأمن الأمريكي في خطر

موقف أوربان من أوكرانيا يدفع المجر إلى حافة القطيعة مع الاتحاد الأوروبي

الأمير هاري يطلب المصالحة والملك يرفض الحديث بسبب الخلاف الأمني الحالي.

الصراع بين الهند وباكستان” تصعيد ينذر بالخطر:ماعلاقة الجماعات الدينية_خاص

كيف سيطر أنصار ترامب على وزارة الخارجية الأمريكية بتعيينات مثيرة للجدل

ترامب يقرر فرض غرامات مالية على كل من يرفض الرحيل من البلاد