دانش بدون نظریه

به یک مقاله جالب برخوردم به نام «روش علمی گوگل». اول به نظرم رسید درباره‌ی گوگل است و اتفاقا چند مثال هم از گوگل دارد، ولی به کمک مثال‌ها به مفهومی فراتر از گوگل می‌رسد که بسیار جالب و خواندنی است.

قسمت‌هایی از آن‌را ترجمه‌ی آزاد کردم ولی اگر به موضوع علاقه‌مند شدید اصل آن را از دست ندهید که مفصل‌تر است.

گروهی بر این باورند که با ظهور بانک‌های اطلاعاتی خیلی خیلی بزرگ، شیوه‌ی یادگیری ما (به عنوان نوع انسان) کاملا دگرگون می‌شود. روش علمی کلاسیک بر اساس ساخت فرضیه و مدلی که رویدادهای تجربی را توصیف کند، پایه‌گذاری شده است. اما ما اکنون به اندازه‌ی کافی داده از مشاهداتمان داریم که بتوانیم بدون این‌که مدل یا فرضیه‌ای داشته باشیم، رویدادها یا مشاهدات بعدی را پیش‌بینی کنیم (کاری که علم انجام می‌دهد: قدرت پیش‌بینی).

غلط‌گیر املایی گوگل

وقتی در گوگل جستجو می‌کنید گوگل غلط‌های املایی‌ شما را در نوشتن کلیدواژه‌ها اصلاح می‌کند و به شما پیشنهاداتی می‌دهد. گوگل برای این‌کار از هیچ تئوری یا مدلی که قوانین درست نوشتن را شرح دهد استفاده نمی‌کند. به جای آن، گوگل روی مجموعه‌ی بزرگی از داده کار می‌کند که متشکل از عبارت‌هایی مانند این است:‌ «x نفر به این سئوال که آیا منظورتان y بود پاسخ بله داده‌اند» استفاده می‌کند. این الگورتیم هیچ تصوری از املای صحیح لغت‌ها در زبان انگلیسی ندارد و فقط به آمار مراجعه می‌کند و می‌تواند غلط‌های املایی را در همه‌ی زبان‌ها اصلاح کند (به شرطی که داده‌ به اندازه‌ی کافی به آن زبان وجود داشته باشد).

ابزار ترجمه‌‌ی گوگل

گوگل از فلسفه‌ی مشابهی برای ترجمه‌ از یک زبان به زبان دیگر استفاده می‌کند. ابزار ترجمه‌ی گوگل می‌تواند متن‌های آلمانی را به چینی یا انگلیسی را به فرانسوی ترجمه کند و این‌کار را با تطبیق‌دهی «عبارت شما» با مجموعه‌ها‌ی عظیم ترجمه‌هایی که توسط انسان انجام شده انجام می‌دهد. برای نمونه، گوگل موتور ترجمه‌ی انگلیسی/فرانسوی خود را با تغذیه‌ی متن‌های کانادایی که معمولا دوزبانه هستند تربیت کرده است. گوگلی‌ها برای این‌کار از هیچ تئوری نحوی زبانی یا الگوریتم هوش مصنوعی استفاده نکرده‌اند. آن‌ها فقط میلیاردها «نکته» و «لینک» دارند که می‌گوید «این آن است» یا به عبارتی «این» در زبان اول «آن» در زبان دوم است. آقای پیتر نورویگ رئیس بخش تحقیقات گوگل با اشاره‌ی پنهان به تجربه‌ی فکری اتاق چینی در نظریه‌ی هوش مصنوعی می‌گوید:

هیچ‌یک از اعضای تیمی که روی موتور ترجمه‌ی چینی گوگل کار می‌کردند، چینی صحبت نمی‌کرد.

دانش بدون نظریه

اگر می‌شود بدون دانستن حتی یک کلمه انگلیسی، غلط‌های املایی عبارت‌های نوشته شده‌ی انگلیسی را گرفت، یا اگر می‌شود بدون دانستن حتی یک کلمه چینی، متون انگلیسی را به چینی ترجمه کرد، سئوالی که مطرح می‌شود این است که دیگر چه چیزهایی را می‌توان بدون داشتن فرضیه یا مدل دریافت؟

آقای کریس‌آندرسن در وایرد (Wired) می‌نویسد:

به کمک ریاضیات کاربردی و با داشتن میزان به اندازه‌ی کافی بزرگ داده (data) از رفتار انسان‌های مختلف، می‌توانیم با دقت کافی رفتار آدم‌ها را پیش‌بینی کنیم. کسی چه می‌داند چرا افراد این‌گونه رفتار می‌کنند، مهم این است که این‌کارها را می‌کنند و ما می‌توانیم آن‌را پیش‌بینی کنیم (معادل این‌که بگوییم: برای چه کسی مهم است که من چینی نمی‌دانم یا می‌دانم، مهم این است که من به اندازه‌ی کافی داده دارم که حدس بزنم ترجمه‌ی این عبارت به چینی چه می‌شود).

پتابایت‌های (هزاران ترابایت) داده کافی هستند که بگوییم هبستگی (correlation) ‌کافی است. می‌توانیم به کمک الگوریتم‌های آماری و محاسبه‌ی خوشه‌ای (cluster computing)، حجم بسیار بزرگی از داده را تحلیل کنیم و نتایج کاربردی و مفید بگیریم، بدون این‌که فرضیه‌ای داشته باشیم که به ما بگوید این‌ها چه معنایی دارند.

دانشمندان علوم مختلف مانند اخترشناسی، فیزیک، ژنتیک، زبان‌شناسی و زمین‌شناسی در حال گردآوری و تولید پیوسته‌ی داده هستند که حجم آن امروز به پتابایت‌ها می‌رسد و در کمتر از یک دهه‌ی دیگر به سطح اکسابایت (exabyte = 1000 petabyte) خواهد رسید. به کمک روش‌های «یادگیری ماشین» (Machine Learning) ماشین‌ها می‌توانند از این دریای اطلاعات الگوهایی استخراج کنند که هیچ انسانی هرگز نمی‌تواند کشف کند. این‌ها الگوهای هبستگی هستند و ممکن است سببی (Causative) باشند یا نباشند،‌ اما به کمک آن‌ها می‌توانیم چیزهای جدید یاد بگیریم. بنابراین آن‌ها کاری را که علم انجام می‌دهد انجام می‌دهند؛ اگرچه نه به شیوه‌ی سنتی.

همیشه اگر همبستگی به اندازه‌ی کافی باشد قابل قبول است. بخش بزرگی از علم پزشکی این‌گونه پیشرفت کرده. پزشک شاید نداند علت اصلی بروز خیلی از بیماری‌ها چیست، اما می‌تواند نشانه‌های آن را تشخیص دهد و مسیر بیماری را پیش‌بینی کند. در واقع مدل درمانی او بر اساس همبستگی تعداد زیادی بیماری با خصوصیات مشابه شکل گرفته است.

نکته‌ی مهم این است که این روش در حال ظهور به یک ابزار جدید در «روش علمی» تبدیل می‌شود و قرار نیست جای‌گزین آن شود.

در همین‌رابطه:


مشترک خوراک بامدادی شوید
کامل
فقط مطالب
فقط لینکدونی
Advertisements