به یک مقاله جالب برخوردم به نام «روش علمی گوگل». اول به نظرم رسید دربارهی گوگل است و اتفاقا چند مثال هم از گوگل دارد، ولی به کمک مثالها به مفهومی فراتر از گوگل میرسد که بسیار جالب و خواندنی است.
قسمتهایی از آنرا ترجمهی آزاد کردم ولی اگر به موضوع علاقهمند شدید اصل آن را از دست ندهید که مفصلتر است.
گروهی بر این باورند که با ظهور بانکهای اطلاعاتی خیلی خیلی بزرگ، شیوهی یادگیری ما (به عنوان نوع انسان) کاملا دگرگون میشود. روش علمی کلاسیک بر اساس ساخت فرضیه و مدلی که رویدادهای تجربی را توصیف کند، پایهگذاری شده است. اما ما اکنون به اندازهی کافی داده از مشاهداتمان داریم که بتوانیم بدون اینکه مدل یا فرضیهای داشته باشیم، رویدادها یا مشاهدات بعدی را پیشبینی کنیم (کاری که علم انجام میدهد: قدرت پیشبینی).
غلطگیر املایی گوگل
وقتی در گوگل جستجو میکنید گوگل غلطهای املایی شما را در نوشتن کلیدواژهها اصلاح میکند و به شما پیشنهاداتی میدهد. گوگل برای اینکار از هیچ تئوری یا مدلی که قوانین درست نوشتن را شرح دهد استفاده نمیکند. به جای آن، گوگل روی مجموعهی بزرگی از داده کار میکند که متشکل از عبارتهایی مانند این است: «x نفر به این سئوال که آیا منظورتان y بود پاسخ بله دادهاند» استفاده میکند. این الگورتیم هیچ تصوری از املای صحیح لغتها در زبان انگلیسی ندارد و فقط به آمار مراجعه میکند و میتواند غلطهای املایی را در همهی زبانها اصلاح کند (به شرطی که داده به اندازهی کافی به آن زبان وجود داشته باشد).

ابزار ترجمهی گوگل
گوگل از فلسفهی مشابهی برای ترجمه از یک زبان به زبان دیگر استفاده میکند. ابزار ترجمهی گوگل میتواند متنهای آلمانی را به چینی یا انگلیسی را به فرانسوی ترجمه کند و اینکار را با تطبیقدهی «عبارت شما» با مجموعههای عظیم ترجمههایی که توسط انسان انجام شده انجام میدهد. برای نمونه، گوگل موتور ترجمهی انگلیسی/فرانسوی خود را با تغذیهی متنهای کانادایی که معمولا دوزبانه هستند تربیت کرده است. گوگلیها برای اینکار از هیچ تئوری نحوی زبانی یا الگوریتم هوش مصنوعی استفاده نکردهاند. آنها فقط میلیاردها «نکته» و «لینک» دارند که میگوید «این آن است» یا به عبارتی «این» در زبان اول «آن» در زبان دوم است. آقای پیتر نورویگ رئیس بخش تحقیقات گوگل با اشارهی پنهان به تجربهی فکری اتاق چینی در نظریهی هوش مصنوعی میگوید:
هیچیک از اعضای تیمی که روی موتور ترجمهی چینی گوگل کار میکردند، چینی صحبت نمیکرد.

دانش بدون نظریه
اگر میشود بدون دانستن حتی یک کلمه انگلیسی، غلطهای املایی عبارتهای نوشته شدهی انگلیسی را گرفت، یا اگر میشود بدون دانستن حتی یک کلمه چینی، متون انگلیسی را به چینی ترجمه کرد، سئوالی که مطرح میشود این است که دیگر چه چیزهایی را میتوان بدون داشتن فرضیه یا مدل دریافت؟
آقای کریسآندرسن در وایرد (Wired) مینویسد:
به کمک ریاضیات کاربردی و با داشتن میزان به اندازهی کافی بزرگ داده (data) از رفتار انسانهای مختلف، میتوانیم با دقت کافی رفتار آدمها را پیشبینی کنیم. کسی چه میداند چرا افراد اینگونه رفتار میکنند، مهم این است که اینکارها را میکنند و ما میتوانیم آنرا پیشبینی کنیم (معادل اینکه بگوییم: برای چه کسی مهم است که من چینی نمیدانم یا میدانم، مهم این است که من به اندازهی کافی داده دارم که حدس بزنم ترجمهی این عبارت به چینی چه میشود).
پتابایتهای (هزاران ترابایت) داده کافی هستند که بگوییم هبستگی (correlation) کافی است. میتوانیم به کمک الگوریتمهای آماری و محاسبهی خوشهای (cluster computing)، حجم بسیار بزرگی از داده را تحلیل کنیم و نتایج کاربردی و مفید بگیریم، بدون اینکه فرضیهای داشته باشیم که به ما بگوید اینها چه معنایی دارند.

دانشمندان علوم مختلف مانند اخترشناسی، فیزیک، ژنتیک، زبانشناسی و زمینشناسی در حال گردآوری و تولید پیوستهی داده هستند که حجم آن امروز به پتابایتها میرسد و در کمتر از یک دههی دیگر به سطح اکسابایت (exabyte = 1000 petabyte) خواهد رسید. به کمک روشهای «یادگیری ماشین» (Machine Learning) ماشینها میتوانند از این دریای اطلاعات الگوهایی استخراج کنند که هیچ انسانی هرگز نمیتواند کشف کند. اینها الگوهای هبستگی هستند و ممکن است سببی (Causative) باشند یا نباشند، اما به کمک آنها میتوانیم چیزهای جدید یاد بگیریم. بنابراین آنها کاری را که علم انجام میدهد انجام میدهند؛ اگرچه نه به شیوهی سنتی.
همیشه اگر همبستگی به اندازهی کافی باشد قابل قبول است. بخش بزرگی از علم پزشکی اینگونه پیشرفت کرده. پزشک شاید نداند علت اصلی بروز خیلی از بیماریها چیست، اما میتواند نشانههای آن را تشخیص دهد و مسیر بیماری را پیشبینی کند. در واقع مدل درمانی او بر اساس همبستگی تعداد زیادی بیماری با خصوصیات مشابه شکل گرفته است.
نکتهی مهم این است که این روش در حال ظهور به یک ابزار جدید در «روش علمی» تبدیل میشود و قرار نیست جایگزین آن شود.
در همینرابطه:
مشترک خوراک بامدادی شوید
کامل
فقط مطالب
فقط لینکدونی
دوست داشتن در حال بارگذاری...