بردهداری مدرن در صنعت هوش مصنوعی
هوش مصنوعی که یک صنعت چند تریلیون دلاری است با نیروی کار نامرئی و مورد استثمار پیش میرود. در واقع بدون کسانی که به هوش مصنوعی توضیح دهند چه چیزی برای انسان چه معنایی میدهد، هوش مصنوعیای در کار نخواهد بود. برچسبزنندگان که در پایینترین زنجیره تأمین هوش مصنوعی قرار دارند همان کسانی هستند که بیشترین کار را انجام میدهند اما کمترین درآمد را دارند. این افراد اغلب در کشورهای جنوب جهانی و بدون شرایط کار شایسته مشغول به خدماترسانی به شرکتهای بزرگ هوش مصنوعی هستند. در این یادداشت سعی میکنیم به این مسئله نگاهی بیندازیم و راهحلهایی برای برخورد انسانیتر به برچسبزنندگان ارائه دهیم.
در کارگاههای پر گرد و غبار، کافینتهای تنگ و تاریک و دفاتر خانگی موقت در سرتاسر جهان، میلیونها نفر پشت رایانهها نشستهاند و به صورت خستهکنندهای روی دادهها برچسبگذاری میکنند. این کارگران، رگ حیات صنعت در حال رشد هوش مصنوعی (AI) هستند. اگر ساده بگوییم، بدون آنها محصولاتی مانند چت جیپیتی (ChatGPT) وجود نداشتند. به این دلیل که دادههایی که آنها برچسبگذاری میکنند به سیستمهای هوش مصنوعی کمک میکند تا یاد بگیرند. بهرغم سهم حیاتی این نیروی کار در صنعتی که انتظار میرود تا سال 2027 به ارزش 407 میلیارد دلار آمریکا برسد، افرادی که آن را تشکیل میدهند عمدتاً نامرئی هستند و اغلب مورد استثمار قرار میگیرند. در اوایل سال جاری، نزدیک به 100 برچسبگذار داده و کارمند هوش مصنوعی از کنیا که برای شرکتهایی مانند فیسبوک، اسکیل ایآی (Scale AI) و اوپن ایآی (OpenAI)» کار میکنند، با امیدی واهی، نامهای سرگشاده خطاب به جو بایدن، رئیسجمهور ایالات متحده منتشر کردند و در آن گفتند: «شرایط کاری ما بردهداری مدرن است.» برای اطمینان از اخلاقی بودن زنجیرههای تأمین هوش مصنوعی، صنعت و دولتها باید فوراً به این مشکل رسیدگی کنند اما سؤال اصلی این است که چگونه باید چنین کاری را انجام داد؟
برچسبگذاری دادهها چیست؟
برچسبگذاری دادهها فرآیند حاشیهنویسی دادههای خام مانند تصاویر، ویدئو یا متن است که از طریق آن سیستمهای هوش مصنوعی میتوانند الگوها را تشخیص دهند تا الگوریتمهای پیشبینی آنها درست کار کند. برای مثال، خودروهای خودران، برای تشخیص عابران پیاده از علائم جادهای، به فیلمهای ویدئویی برچسبگذاری شده تکیه میکنند. مدلهای زبان بزرگ مانند «چت جیپیتی» برای درک زبان انسانی به متن برچسبگذاری شده تکیه میکنند. این مجموعه دادههای برچسبگذاری شده، رگ حیاتی مدلهای هوش مصنوعی هستند؛ بدون آنها، سیستمهای هوش مصنوعی نمیتوانند بهطور مؤثر عمل کنند. غولهای فناوری مانند متا، گوگل، اوپن ایآی و مایکروسافت، بیشتر این کار را به کارگارههای برچسبگذاری داده در کشورهایی مانند فیلیپین، کنیا، هند، پاکستان، ونزوئلا و کلمبیا برونسپاری میکنند. البته چین هم در حال تبدیل شدن به یکی دیگر از قطبهای جهانی برای برچسبگذاری دادههاست.
شرکتهای برونسپاری که این کار را تسهیل میکنند در نوع خود شرکتهای بسیار بزرگی هستند. مثالهایی از این بنگاهها میتواند شامل شرکتهای اسکیل ایآی، iMerit و Samasource باشد که در سالهای اخیر ارزش مالی زیادی بهدست آوردهاند. بهعنوان مثال، «اسکیل ایآی» که دفتر مرکزی آن در کالیفرنیا قرار دارد، اکنون ۱۴ میلیارد دلار ارزش دارد.
کمکردن خرج
شرکتهای بزرگ فناوری مانند آلفابت (شرکت مادر گوگل)، آمازون، مایکروسافت، انویدیا و متا میلیاردها دلار را در زیرساختهای هوش مصنوعی، از قدرت محاسباتی و ذخیرهسازی دادهها گرفته تا فناوریهای محاسباتی نوظهور سرمایهگذاری کردهاند. آموزش مدلهای هوش مصنوعی در مقیاس بزرگ میتواند دهها میلیون دلار هزینه داشته باشد. همچنین پس از استقرار این مدلها، حفظ آنها نیز مستلزم سرمایهگذاری مستمر در برچسبگذاری دادهها، اصلاح و آزمایش در دنیای واقعی است.
در حالی که سرمایهگذاری در هوش مصنوعی قابلتوجه است، درآمدها از این صنعت همیشه انتظارات را برآورده نکرده است. شاید یکی از دلایل آن این است که بسیاری از صنایع همچنان پروژههای هوش مصنوعی را آزمایشی میدانند و مسیرهای سودآوری هوش مصنوعی را نامشخص فرض میکنند. به همین دلیل و بهعنوان پاسخی به این وضعیت عدم سودآوری مورد انتظار، بسیاری از شرکتهایی که در زمینه هوش مصنوعی فعال هستند هزینهها را کاهش میدهند؛ این کاهش هزینه بر کسانی که در انتهای زنجیره تأمین هوش مصنوعی فعالیت میکنند و اغلب بسیار آسیبپذیر هستند، تأثیر بیشتری میگذارد؛ این افراد کسی نیستند به جز برچسبزنندگان دادههای هوش مصنوعی.
دستمزد کم، شرایط کاری خطرناک
یکی از راههایی که شرکتهای درگیر در زنجیره تأمین هوش مصنوعی تلاش میکنند هزینهها را از طریق آن کاهش دهند، استفاده از تعداد زیادی برچسبزننده داده در کشورهای جنوب جهانی مانند فیلیپین، ونزوئلا، کنیا و هند است. کارگران در این کشورها با رکود یا کاهش دستمزد مواجه هستند. بهعنوان مثال، نرخ ساعتی برای برچسبگذاران دادههای هوش مصنوعی در ونزوئلا از 90 سنت تا 2 دلار آمریکا متغیر است. در مقایسه، در ایالات متحده، این نرخ بین 10 تا 25 دلار در ساعت است که خبر از اختلاف عظیمی میدهد. در فیلیپین، کارگرانی که دادههای شرکتهای چند میلیارد دلاری مانند اسکیل ایآی را برچسبگذاری میکنند، اغلب بسیار کمتر از حداقل دستمزد دریافت میکنند. بهعلاوه در بسیاری از این کشورها برخی از ارائهدهندگان برچسبزدن حتی برای اهداف خود به کار کودکان نیز متوسل میشوند. برای نمونه بسیاری از برچسبزنندگان داده در محیطهای پر ازدحام و پر از گردوغبار کار میکنند که خطری جدی برای سلامتی است. آنها همچنین اغلب بهعنوان پیمانکاران مستقل کار میکنند و به حمایتهایی مانند مراقبتهای بهداشتی یا غرامت، بیمه بیکاری و حمایتهای تأمیناجتماعی دسترسی ندارند. ضرر ذهنی کار برچسبگذاری دادهها نیز قابلتوجه است؛ این کار با وظایف تکراری، ضربالاجلهای سختگیرانه و کنترل کیفیت سفت و سخت همراه است. همچنین گاهی اوقات از برچسبگذاران داده خواسته میشود که سخنان تنفرآمیز یا سایر مسائل ناپسند که به قالب زبان در میآید و یا مطالب توهینآمیز را بخوانند و برچسبگذاری کنند؛ مسئلهای که ثابت شده، اثرات روانی منفی برای برچسبگذاران به همراه دارد.
در این صنعت اشتباهات میتواند منجر به کاهش دستمزد یا از دست دادن شغل شود اما مشکل آنجایی بیشتر میشود که برچسبگذاران اغلب عدم شفافیت را در مورد نحوه ارزیابی کارشان تجربه میکنند. آنها نمیدانند که کارشان را چقدر خوب یا بد انجام دادهاند؛ چراکه اغلب از دسترسی به دادههای عملکرد خود محروم هستند. این موضوع مانع از توانایی آنها برای بهبود یا رقابت در تصمیمگیریهای بعدی میشود.
در کارگاههای پر گرد و غبار، کافینتهای تنگ و تاریک و دفاتر خانگی موقت در سرتاسر جهان، میلیونها نفر پشت رایانهها نشستهاند و به صورت خستهکنندهای روی دادهها برچسبگذاری میکنند. این کارگران، رگ حیات صنعت در حال رشد هوش مصنوعی (AI) هستند. اگر ساده بگوییم، بدون آنها محصولاتی مانند چت جیپیتی (ChatGPT) وجود نداشتند. به این دلیل که دادههایی که آنها برچسبگذاری میکنند به سیستمهای هوش مصنوعی کمک میکند تا یاد بگیرند. بهرغم سهم حیاتی این نیروی کار در صنعتی که انتظار میرود تا سال 2027 به ارزش 407 میلیارد دلار آمریکا برسد، افرادی که آن را تشکیل میدهند عمدتاً نامرئی هستند و اغلب مورد استثمار قرار میگیرند. در اوایل سال جاری، نزدیک به 100 برچسبگذار داده و کارمند هوش مصنوعی از کنیا که برای شرکتهایی مانند فیسبوک، اسکیل ایآی (Scale AI) و اوپن ایآی (OpenAI)» کار میکنند، با امیدی واهی، نامهای سرگشاده خطاب به جو بایدن، رئیسجمهور ایالات متحده منتشر کردند و در آن گفتند: «شرایط کاری ما بردهداری مدرن است.» برای اطمینان از اخلاقی بودن زنجیرههای تأمین هوش مصنوعی، صنعت و دولتها باید فوراً به این مشکل رسیدگی کنند اما سؤال اصلی این است که چگونه باید چنین کاری را انجام داد؟
برچسبگذاری دادهها چیست؟
برچسبگذاری دادهها فرآیند حاشیهنویسی دادههای خام مانند تصاویر، ویدئو یا متن است که از طریق آن سیستمهای هوش مصنوعی میتوانند الگوها را تشخیص دهند تا الگوریتمهای پیشبینی آنها درست کار کند. برای مثال، خودروهای خودران، برای تشخیص عابران پیاده از علائم جادهای، به فیلمهای ویدئویی برچسبگذاری شده تکیه میکنند. مدلهای زبان بزرگ مانند «چت جیپیتی» برای درک زبان انسانی به متن برچسبگذاری شده تکیه میکنند. این مجموعه دادههای برچسبگذاری شده، رگ حیاتی مدلهای هوش مصنوعی هستند؛ بدون آنها، سیستمهای هوش مصنوعی نمیتوانند بهطور مؤثر عمل کنند. غولهای فناوری مانند متا، گوگل، اوپن ایآی و مایکروسافت، بیشتر این کار را به کارگارههای برچسبگذاری داده در کشورهایی مانند فیلیپین، کنیا، هند، پاکستان، ونزوئلا و کلمبیا برونسپاری میکنند. البته چین هم در حال تبدیل شدن به یکی دیگر از قطبهای جهانی برای برچسبگذاری دادههاست.
شرکتهای برونسپاری که این کار را تسهیل میکنند در نوع خود شرکتهای بسیار بزرگی هستند. مثالهایی از این بنگاهها میتواند شامل شرکتهای اسکیل ایآی، iMerit و Samasource باشد که در سالهای اخیر ارزش مالی زیادی بهدست آوردهاند. بهعنوان مثال، «اسکیل ایآی» که دفتر مرکزی آن در کالیفرنیا قرار دارد، اکنون ۱۴ میلیارد دلار ارزش دارد.
کمکردن خرج
شرکتهای بزرگ فناوری مانند آلفابت (شرکت مادر گوگل)، آمازون، مایکروسافت، انویدیا و متا میلیاردها دلار را در زیرساختهای هوش مصنوعی، از قدرت محاسباتی و ذخیرهسازی دادهها گرفته تا فناوریهای محاسباتی نوظهور سرمایهگذاری کردهاند. آموزش مدلهای هوش مصنوعی در مقیاس بزرگ میتواند دهها میلیون دلار هزینه داشته باشد. همچنین پس از استقرار این مدلها، حفظ آنها نیز مستلزم سرمایهگذاری مستمر در برچسبگذاری دادهها، اصلاح و آزمایش در دنیای واقعی است.
در حالی که سرمایهگذاری در هوش مصنوعی قابلتوجه است، درآمدها از این صنعت همیشه انتظارات را برآورده نکرده است. شاید یکی از دلایل آن این است که بسیاری از صنایع همچنان پروژههای هوش مصنوعی را آزمایشی میدانند و مسیرهای سودآوری هوش مصنوعی را نامشخص فرض میکنند. به همین دلیل و بهعنوان پاسخی به این وضعیت عدم سودآوری مورد انتظار، بسیاری از شرکتهایی که در زمینه هوش مصنوعی فعال هستند هزینهها را کاهش میدهند؛ این کاهش هزینه بر کسانی که در انتهای زنجیره تأمین هوش مصنوعی فعالیت میکنند و اغلب بسیار آسیبپذیر هستند، تأثیر بیشتری میگذارد؛ این افراد کسی نیستند به جز برچسبزنندگان دادههای هوش مصنوعی.
دستمزد کم، شرایط کاری خطرناک
یکی از راههایی که شرکتهای درگیر در زنجیره تأمین هوش مصنوعی تلاش میکنند هزینهها را از طریق آن کاهش دهند، استفاده از تعداد زیادی برچسبزننده داده در کشورهای جنوب جهانی مانند فیلیپین، ونزوئلا، کنیا و هند است. کارگران در این کشورها با رکود یا کاهش دستمزد مواجه هستند. بهعنوان مثال، نرخ ساعتی برای برچسبگذاران دادههای هوش مصنوعی در ونزوئلا از 90 سنت تا 2 دلار آمریکا متغیر است. در مقایسه، در ایالات متحده، این نرخ بین 10 تا 25 دلار در ساعت است که خبر از اختلاف عظیمی میدهد. در فیلیپین، کارگرانی که دادههای شرکتهای چند میلیارد دلاری مانند اسکیل ایآی را برچسبگذاری میکنند، اغلب بسیار کمتر از حداقل دستمزد دریافت میکنند. بهعلاوه در بسیاری از این کشورها برخی از ارائهدهندگان برچسبزدن حتی برای اهداف خود به کار کودکان نیز متوسل میشوند. برای نمونه بسیاری از برچسبزنندگان داده در محیطهای پر ازدحام و پر از گردوغبار کار میکنند که خطری جدی برای سلامتی است. آنها همچنین اغلب بهعنوان پیمانکاران مستقل کار میکنند و به حمایتهایی مانند مراقبتهای بهداشتی یا غرامت، بیمه بیکاری و حمایتهای تأمیناجتماعی دسترسی ندارند. ضرر ذهنی کار برچسبگذاری دادهها نیز قابلتوجه است؛ این کار با وظایف تکراری، ضربالاجلهای سختگیرانه و کنترل کیفیت سفت و سخت همراه است. همچنین گاهی اوقات از برچسبگذاران داده خواسته میشود که سخنان تنفرآمیز یا سایر مسائل ناپسند که به قالب زبان در میآید و یا مطالب توهینآمیز را بخوانند و برچسبگذاری کنند؛ مسئلهای که ثابت شده، اثرات روانی منفی برای برچسبگذاران به همراه دارد.
در این صنعت اشتباهات میتواند منجر به کاهش دستمزد یا از دست دادن شغل شود اما مشکل آنجایی بیشتر میشود که برچسبگذاران اغلب عدم شفافیت را در مورد نحوه ارزیابی کارشان تجربه میکنند. آنها نمیدانند که کارشان را چقدر خوب یا بد انجام دادهاند؛ چراکه اغلب از دسترسی به دادههای عملکرد خود محروم هستند. این موضوع مانع از توانایی آنها برای بهبود یا رقابت در تصمیمگیریهای بعدی میشود.
ارسال دیدگاه