هفته نامه آتیه نو

برده‌داری مدرن در صنعت هوش مصنوعی

هوش مصنوعی که یک صنعت چند تریلیون دلاری است با نیروی کار نامرئی و مورد استثمار پیش می‌رود. در واقع بدون کسانی که به هوش مصنوعی توضیح دهند چه چیزی برای انسان چه معنایی می‌دهد، هوش مصنوعی‌ای در کار نخواهد بود. برچسب‌زنندگان که در پایین‌ترین زنجیره تأمین هوش مصنوعی قرار دارند همان کسانی هستند که بیشترین کار را انجام می‌دهند اما کمترین درآمد را دارند. این افراد اغلب در کشورهای جنوب جهانی و بدون شرایط کار شایسته مشغول به خدمات‌رسانی به شرکت‌های بزرگ هوش مصنوعی هستند. در این یادداشت سعی می‌کنیم به این مسئله نگاهی بیندازیم و راه‌حل‌هایی برای برخورد انسانی‌تر به برچسب‌زنندگان ارائه دهیم.

در کارگاه‌های پر گرد و غبار، کافی‌نت‌های تنگ و تاریک و دفاتر خانگی موقت در سرتاسر جهان، میلیون‌ها نفر پشت رایانه‌ها نشسته‌اند و به‌ صورت خسته‌کننده‌ای روی داده‌ها برچسب‌گذاری می‌کنند. این کارگران، رگ حیات صنعت در حال رشد هوش مصنوعی (AI) هستند. اگر ساده بگوییم، بدون آن‌ها محصولاتی مانند چت جی‌پی‌تی (ChatGPT) وجود نداشتند. به این دلیل که داده‌هایی که آن‌ها برچسب‌گذاری می‌کنند به سیستم‌های هوش مصنوعی کمک می‌کند تا یاد بگیرند. به‌‌رغم سهم حیاتی این نیروی کار در صنعتی که انتظار می‌رود تا سال 2027 به ارزش 407 میلیارد دلار آمریکا برسد، افرادی که آن را تشکیل می‌دهند عمدتاً نامرئی هستند و اغلب مورد استثمار قرار می‌گیرند. در اوایل سال جاری، نزدیک به 100 برچسب‌گذار داده و کارمند هوش مصنوعی از کنیا که برای شرکت‌هایی مانند فیس‌بوک، اسکیل ای‌آی (Scale AI) و اوپن ای‌آی (OpenAI)» کار می‌کنند، با امیدی واهی، نامه‌ای سرگشاده خطاب به جو بایدن، رئیس‌جمهور ایالات متحده منتشر کردند و در آن گفتند: «شرایط کاری ما برده‌داری مدرن است.» برای اطمینان از اخلاقی بودن زنجیره‌های تأمین هوش مصنوعی، صنعت و دولت‌ها باید فوراً به این مشکل رسیدگی کنند اما سؤال اصلی این است که چگونه باید چنین کاری را انجام داد؟

برچسب‌گذاری داده‌ها چیست؟
برچسب‌گذاری داده‌ها فرآیند حاشیه‌نویسی داده‌های خام مانند تصاویر، ویدئو یا متن است که از طریق آن سیستم‌های هوش مصنوعی می‌توانند الگوها را تشخیص دهند تا الگوریتم‌های پیش‌بینی آن‌ها درست کار کند. برای مثال، خودروهای خودران، برای تشخیص عابران پیاده از علائم جاده‌ای، به فیلم‌های ویدئویی برچسب‌گذاری شده تکیه می‌کنند. مدل‌های زبان بزرگ مانند «چت جی‌پی‌تی» برای درک زبان انسانی به متن برچسب‌گذاری شده تکیه می‌کنند. این مجموعه داده‌های برچسب‌گذاری شده، رگ حیاتی مدل‌های هوش مصنوعی هستند؛ بدون آن‌ها، سیستم‌های هوش مصنوعی نمی‌توانند به‌طور مؤثر عمل کنند. غول‌های فناوری مانند متا، گوگل، اوپن ای‌آی و مایکروسافت، بیشتر این کار را به کارگاره‌های برچسب‌گذاری داده در کشورهایی مانند فیلیپین، کنیا، هند، پاکستان، ونزوئلا و کلمبیا برون‌سپاری می‌کنند. البته چین هم در حال تبدیل شدن به یکی دیگر از قطب‌های جهانی برای برچسب‌گذاری داده‌هاست.
شرکت‌های برون‌سپاری که این کار را تسهیل می‌کنند در نوع خود شرکت‌های بسیار بزرگی هستند. مثال‌هایی از این بنگاه‌ها می‌تواند شامل شرکت‌های اسکیل ای‌آی، iMerit و Samasource باشد که در سال‌های اخیر ارزش مالی زیادی به‌دست آورده‌اند. به‌عنوان مثال، «اسکیل ای‌آی» که دفتر مرکزی آن در کالیفرنیا قرار دارد، اکنون ۱۴ میلیارد دلار ارزش دارد.
کم‌کردن خرج
شرکت‌های بزرگ فناوری مانند آلفابت (شرکت مادر گوگل)، آمازون، مایکروسافت، انویدیا و متا میلیاردها دلار را در زیرساخت‌های هوش مصنوعی، از قدرت محاسباتی و ذخیره‌سازی داده‌ها گرفته تا فناوری‌های محاسباتی نوظهور سرمایه‌گذاری کرده‌اند. آموزش مدل‌های هوش مصنوعی در مقیاس بزرگ می‌تواند ده‌ها میلیون دلار هزینه داشته باشد. همچنین پس از استقرار این مدل‌ها، حفظ آن‌ها نیز مستلزم سرمایه‌گذاری مستمر در برچسب‌گذاری داده‌ها، اصلاح و آزمایش در دنیای واقعی است.
در حالی که سرمایه‌گذاری در هوش مصنوعی قابل‌توجه است، درآمدها از این صنعت همیشه انتظارات را برآورده نکرده‌ است. شاید یکی از دلایل آن این است که بسیاری از صنایع همچنان پروژه‌های هوش مصنوعی را آزمایشی می‌دانند و مسیرهای سودآوری هوش مصنوعی را نامشخص فرض می‌کنند. به همین دلیل و به‌عنوان پاسخی به این وضعیت عدم سودآوری مورد انتظار، بسیاری از شرکت‌هایی که در زمینه هوش مصنوعی فعال هستند هزینه‌ها را کاهش می‌دهند؛ این کاهش هزینه بر کسانی که در انتهای زنجیره تأمین هوش مصنوعی فعالیت می‌کنند و اغلب بسیار آسیب‌پذیر هستند، تأثیر بیشتری می‌گذارد؛ این افراد کسی نیستند به جز برچسب‌زنندگان داده‌های هوش مصنوعی.

دستمزد کم، شرایط کاری خطرناک
یکی از راه‌هایی که شرکت‌های درگیر در زنجیره تأمین هوش مصنوعی تلاش می‌کنند هزینه‌ها را از طریق آن کاهش دهند، استفاده از تعداد زیادی برچسب‌زننده داده در کشورهای جنوب جهانی مانند فیلیپین، ونزوئلا، کنیا و هند است. کارگران در این کشورها با رکود یا کاهش دستمزد مواجه هستند. به‌عنوان مثال، نرخ ساعتی برای برچسب‌گذاران داده‌های هوش مصنوعی در ونزوئلا از 90 سنت تا 2 دلار آمریکا متغیر است. در مقایسه، در ایالات متحده، این نرخ بین 10 تا 25 دلار در ساعت است که خبر از اختلاف عظیمی‌ می‌دهد. در فیلیپین، کارگرانی که داده‌های شرکت‌های چند میلیارد دلاری مانند اسکیل ای‌آی را برچسب‌گذاری می‌کنند، اغلب بسیار کمتر از حداقل دستمزد دریافت می‌کنند. به‌علاوه در بسیاری از این کشورها برخی از ارائه‌دهندگان برچسب‌زدن حتی برای اهداف خود به کار کودکان نیز متوسل می‌شوند. برای نمونه بسیاری از برچسب‌زنندگان داده در محیط‌های پر ازدحام و پر از گرد‌و‌غبار کار می‌کنند که خطری جدی برای سلامتی است. آن‌ها همچنین اغلب به‌عنوان پیمانکاران مستقل کار می‌کنند و به حمایت‌هایی مانند مراقبت‌های بهداشتی یا غرامت، بیمه بیکاری و حمایت‌های تأمین‌اجتماعی دسترسی ندارند. ضرر ذهنی کار برچسب‌گذاری داده‌ها نیز قابل‌توجه است؛ این کار با وظایف تکراری، ضرب‌الاجل‌های سخت‌گیرانه و کنترل‌ کیفیت سفت و سخت همراه است. همچنین گاهی اوقات از برچسب‌گذاران داده خواسته می‌شود که سخنان تنفرآمیز یا سایر مسائل ناپسند که به قالب زبان در می‌آید و یا مطالب توهین‌آمیز را بخوانند و برچسب‌گذاری کنند؛ مسئله‌ای که ثابت شده، اثرات روانی منفی برای برچسب‌گذاران به همراه دارد.
در این صنعت اشتباهات می‌تواند منجر به کاهش دستمزد یا از دست دادن شغل شود اما مشکل آنجایی بیشتر می‌شود که برچسب‌گذاران اغلب عدم شفافیت را در مورد نحوه ارزیابی کارشان تجربه می‌کنند. آن‌ها نمی‌دانند که کارشان را چقدر خوب یا بد انجام داده‌اند؛ چراکه اغلب از دسترسی به داده‌های عملکرد خود محروم هستند. این موضوع مانع از توانایی آن‌ها برای بهبود یا رقابت در تصمیم‌گیری‌های بعدی می‌شود.