گسترش مدلهای زبانی بزرگ (مدلهای زبانی بزرگ) میتواند شیوه تحلیل دادههای گسترده دیجیتال را بهطور اساسی تغییر دهد و نگرانیهای تازهای درباره حریم خصوصی کاربران ایجاد کند.
بر اساس این گزارش، این فناوریها قادرند حجم عظیمی از دادههای جمعآوریشده توسط «کارگزاران داده» را پردازش کرده و اطلاعات پراکنده افراد در فضای آنلاین را به پروفایلهای دقیق و قابل شناسایی تبدیل کنند.
کارگزاران داده شرکتهایی هستند که اطلاعاتی مانند جستوجوهای اینترنتی، خریدها و دادههای موقعیت مکانی میلیونها کاربر را جمعآوری کرده و به مشتریان مختلف، از جمله برخی نهادها، عرضه میکنند.
در گذشته، تحلیل چنین حجم عظیمی از دادهها نیازمند تیمهای بزرگ تحلیلگران بود، اما اکنون سیستمهای مبتنی بر مدلهای زبانی میتوانند همین فرآیند را با سرعت بیشتر و هزینه کمتر انجام دهند.
مطالعات نشان میدهد این مدلها توانایی دارند دادههای به ظاهر ناشناس را نیز بازشناسایی کرده و آنها را به هویت واقعی افراد متصل کنند؛ برای مثال با ترکیب دادههای مکانی، محل کار و محل سکونت، امکان شناسایی کاربران افزایش مییابد.
همچنین گزارشها حاکی است این فناوریها میتوانند حسابهای ناشناس در اینترنت را به پروفایلهای واقعی در شبکههای اجتماعی مرتبط کرده و حتی ویژگیهایی مانند زبان مادری، موقعیت جغرافیایی و سطح درآمد را تخمین بزنند.
کارشناسان معتقدند ترکیب دادههای حجیم با توان پردازشی مدلهای زبانی میتواند امکان پایش همزمان رفتار میلیونها کاربر را فراهم کند و مفهوم سنتی حریم خصوصی دیجیتال را با چالشهای جدی مواجه سازد.
با وجود این، تاکید شده است که هنوز شواهد قطعی از استفاده گسترده و سازمانیافته از این ظرفیتها در سطح جهانی وجود ندارد، اما روند توسعه این فناوریها نگرانیهای فزایندهای در حوزه نظارت دیجیتال ایجاد کرده است.




