اصل سادگی در علم
اصل اوکام سادگی را ارزش علمی می‌داند؛ اما توجیه فلسفی این اصل بسیار دشوار است
سه شنبه ۱۵ تير ۱۳۹۵ ۰۹:۰۳
 
اینشتین زمانی گفته بود: «هدف اصلی نظریۀ علمی این است که عناصر پایه را تا جایی که ممکن است، ساده و کم کند»؛ امروزه اغلب اندیشمندان این حرف او را تأیید می‌کنند. بنابراین با پیچیده‌شدنِ نظریه‌ها، دانشمندان دست‌به‌دامان تیغ اوکام یا اصل صرفه‌جویی می‌شوند تا آن‌ها را اصلاح کنند. این اصل می‌گوید نظریه‌ای که اشیا، فرایندها یا عللِ کمتری را فرض می‌کند، بهتر از نظریه‌ای است که تعداد بیشتری را فرض می‌کند. اما «بهتر» یعنی چه؟
تخمین زمان مطالعه : ۱۴ دقيقه
 
 

ایان — دو شاهکار معماریِ بارسلونا بی‌نهایت با هم متفاوت‌اند. ساگرادا فامیلیا که آنتونی گاودی آن را طراحی کرده است، تنها چند مایل از عمارت آلمانی که مایز وِن دِر روهه ساخته است، فاصله دارد. کلیسای گاودی پرزرق‌وبرق و پیچیده است. عمارت مایز آرام و ساده است. مایز، پیشوای معماری کمینه‌گرا، از شعار «کمتر بیشتر است» برای بیان چیزی استفاده می‌کرد که به‌دنبال آن بود. گاودی هیچ‌گاه نگفت «بیشتر بیشتر است»؛ اما ساختمان‌هایی که ساخته است، نشان می‌دهد که این چیزی است که او به‌دنبال آن بود.

یک عکس‌العمل دربرابر تضاد بین مایز و گاودی، طرف‌داری‌کردن از یکی ازآن‌هاست بر مبنای این اعتقاد که: هنر چگونه باید باشد؟ اگر هنر باید تماماً ساده یا تماماً پیچیده باشد، انتخاب ساده است. اما هر دوی این هنجارها نامعقول به نظر می‌رسند. آیا اینطور نیست که بخش درخورِاحترامی از هنرْ ساده و بخش درخورِاحترام دیگری از آن پیچیده است؟ درست است. ممکن است مواردی افراطی وجود داشته باشند که فراتر از مرزند. ما از هنرهایی که بیش‌ازحد پیچیده هستند، رو برمی‌گردانیم و کارهایی هم که بسیار ساده‌اند، حوصلۀ ما را سر می‌برند. اما بین این دو حد افراطی، فضایِ امکانیِ بزرگی وجود دارد. هنرمندان مختلف اهداف متفاوتی دارند. همۀ کارهای هنری باید درجۀ درستی از پیچیدگی داشته باشند. هنرمندان به‌دنبال این نیستند که این درجه را کشف کنند. چنین ایدئالِ بی‌زمانی وجود ندارد.

حداقل از نظر بسیاری از دانشمندان، علم در این موضوع با هنر متفاوت است. اینشتین زمانی که این جملات را می‌گفت، حرفی می‌زد که امروزه بسیاری از دانشمندان آن را می‌پذیرند: «به‌سختی می‌توان انکار کرد که هدف اصلی نظریۀ علمی این است که عناصر پایۀ غیرقابل‌فروکاهش را تا جایی که ممکن است، ساده و کم کند؛ بدون اینکه مجبور باشد از بازنمایی کامل یک دادۀ تجربه دست بکشد.» بنابراین تلاش برای یافتن ِنظریه‌های ساده یکی از لازمه‌های فعالیت علمی است. هنگامی که نظریه‌ها بسیار پیچیده می‌شوند، دانشمندان دست‌به‌دامان تیغ اوکام۱ یا اصل صرفه‌جویی۲ می‌شوند تا اصلاحات را روی نظریه‌ها انجام دهند. این اصل می‌گوید نظریه‌ای که اشیا، فرایندها یا عللِ کمتری را فرض

طبیعتْ ساده است و تسلیم عللِ زائد و تجملی نمی‌شود.
می‌کند، بهتر از نظریه‌ای است که تعداد بیشتری را فرض می‌کند؛ البته تاجایی‌ که نظریۀساده‌تر با چیزی که مشاهده می‌کنیم، سازگار است. اما «بهتر» یعنی چه؟ واضح است که نظریه‌های ساده‌ترمی‌توانند زیباتر و زودفهم‌تر باشند و آزمایش و به‌خاطرسپردن آن‌ها نیز ساده‌تر است. سختیِ مسئلۀ اینجاست که بتوانیم توضیح دهیم که: چرا این حقیقت که نظریه‌ای ساده‌تر از نظریۀ دیگری است، دربارۀ چگونگی وجود جهان به شما هیچ چیزی نمی‌گوید.

یکی از پشتیبانی‌های علمی بسیار مشهور از تیغ اوکام را می‌توان در کتاب اصول ریاضیاتی فلسفۀ طبیعی۳ (۱۶۷۸) آیزاک نیوتن یافت؛ آنجا که او «چهار قانون استدلال» را بیان می‌کند. این دو قانونِ اول اوست:

قانون ۱. برای چیزهای طبیعی نباید هیچ علتی اضافه بر چیزی که برای تبیین ِآن پدیده‌ها درست و کامل است، فرض شود. همان‌طور که فیلسوفان می‌گویند، طبیعت هیچ کاری را در خلاء نمی‌کند؛ حال‌آنکه عللِ بیشتر، وقتی تعداد کمتری از علل کفایت می‌کنند، در خلاء خواهند بود. این از آن روست که طبیعتْ ساده است و تسلیم عللِ زائد و تجملی نمی‌شود.

قانون ۲. بنابراین، عللی که به معلول‌هایی طبیعی و هم‌سنخ داده می‌شوند، باید تا حد ممکن خود نیز هم‌سنخ باشند. مثال‌های آن شامل علت تنفس در انسان و حیوان، سقوط سنگ در امریکا و اروپا، نور آتش در آشپزخانه و خورشید یا بازتاب نور بر زمین و دیگر سیارات است.

نیوتن تلاشی برای توجیه این قوانین نمی‌کند؛ اما در تفسیر منتشرنشده‌ای بر کتاب مکاشفات۴ توضیحات بیشتری می‌دهد. این یکی از «قوانینِ روش‌مندکردن یا تأویل‌کردنِ مکاشفات» است:

تأویلاتی را برگزینیم که بدون صدمه‌زدن، چیزها را به بیشترین سادگی می‌رسانند. دلیلِ آن این است... [که] صدق را تنها می‌توان در سادگی یافت؛ نه در تعدد و آشفتگی چیزها. این کمالِ کارهای خداست که همۀآن‌ها با بیشترین سادگی انجام می‌شوند. او خدای نظم است، نه آشفتگی. بنابراین کسانی که به‌دنبال فهم ساختار جهان هستند، باید تلاش کنند معرفت خود را به بیشترین سادگی برسانند؛ یعنی باید در تلاش برای رسیدن به این دیدگاه‌ها باشند.

نیوتن فکر می‌کرد که ترجیح نظریه‌های ساده‌تر معنادار است؛ چه به‌هدف تفسیر کتاب مقدس باشد چه برای کشف قوانین فیزیک. تیغ اوکام در هر دو جنبه درست است؛ زیرا جهان را خدا خلق کرده است.

***

در قرن بیستم فیلسوفان، آماردانان و دانشمندان در فهم اینکه چرا سادگیِ یک نظریه می‌تواند در بررسیِ جهان

صدق را تنها می‌توان در سادگی یافت؛ نه در تعدد و آشفتگی چیزها.
مؤثر باشد، پیشرفت‌هایی به دست آوردند. توجیهِ آنان برای تیغ اوکام مبتنی بر الهیات نیست و بر این فرض بزرگ نیز تکیه نمی‌کنندکه جهان ساده است. حداقل سه «پارادایم صرفه‌جویی» وجود دارد که می‌توان بر مبنای آن‌ها تیغ اوکام را توجیه کرد.

اولین پارادایم در این توصیه به دانشجویان پزشکی ظاهر می‌شود که آن‌ها باید از «دنبال‌کردن گورخرها» بپرهیزند. اگر می‌توان علائم فردِ بیمار را با یکی از این دو فرض تبیین کرد که او یا بیماری فراگیرِ A را دارد یا بیماری بسیار نادر B را، باید تشخیص A را ترجیح دهید. گفته می‌شود که A صرفه‌جویانه‌تر است. در این مورد، هرچه فرضیه صرفه‌جویانه‌تر باشد، احتمال درست‌تربودن آن بیشتر است.

موقعیت دیگری نیز وجود دارد که در آن نظریه‌های ساده‌تر احتمال بیشتری دارند. این نسخه‌ای از تیغ اوکام است که من آن را «تیغ سکوت» می‌نامم. اگر شما بیّنه‌ای دارید که A علت C است و هیچ بیّنه‌ای ندارید که B علت C است، در این صورت A برای C تبیین بهتری است نسبت‌به A&B. فیلسوف قرن نوزدهمی جان استوارت میل به این موارد فکر می‌کرد، زمانی که گفت اصل صرفه‌جویی

مصداقی از این اصلِ عملیِ فراگیر است که هیچ چیز بدون بینه‌ای را باور نکنیم... فرضِ یک علت زائد، باوری بدون بینه است. انگار باید فرض کنیم فردی که به‌خاطرِ افتادن از پرتگاه مرده است، سم نیز خورده است.

استوارت میل دربارۀ تیغ سکوت حرف می‌زند. تبیین بهتر C دربارۀ B ساکت است؛ انکار نمی‌کند که B هم علت بوده است. اگر دو فرضیۀ عطفی را در نظر بگیرید، مسئله تغییر می‌کند. تبیین بهتر C کدام است: A&notB یا A&B؟ تیغ سکوت اینجا کمکی نمی‌کند؛ اما تیغ دیگر یعنی تیغ انکار کمک می‌کند. تیغ انکار به شما می‌گوید اولی را انتخاب کنید. متأسفانه واضح نیست که اگر هیچ بینه‌ای نداشته باشد، چه توجیهی برای این ادعا وجود دارد که Bدرست است یا نه. تیغ سکوت را به‌سادگی می‌توان توجیه کرد؛ اما توجیه تیغ انکار دشوارتر است.

در مثال بیماری رایج و نادر، هر دو فرضیه، احتمال مشابهی به مشاهدات می‌دهند. پارادایم دومِ صرفه‌جویی بر موقعیت‌هایی تمرکز می‌کند که در آن فرضیۀ ساده‌تر و فرضیۀپیچیده‌تر احتمالات متفاوتی به مشاهدات می‌دهند. در بسیاری از این موارد، بینه از نظریۀ ساده‌تر در برابر فرضیۀ پیچیده‌تر دفاع می‌کند؛ مثلاً فرض کنید همۀ چراغ‌ها در اطراف شما خاموش شود. در این صورت شما دو فرضیه را در نظر می‌گیرید:

الف. در پایگاه برق در ساعت هشت صبح سه‌شنبه اتفاقی افتاده و بر همۀ این نورها
اصل صرفه‌جویی مصداقی از این اصلِ عملیِ فراگیر است که می‌گوید نباید هیچ چیز بدون بینه‌ای را باور کنیم
تأثیر گذاشته است؛

ب. برای هر کدام از لامپ‌ها در ساعت هشت صبح سه‌شنبه اتفاقی افتاده است و بر این نورها تأثیر گذاشته است.

فرض علتی واحد با صرفه‌جوییْ بسیار سازگارتر است تا فرضِ تعداد بسیار زیادی از علل مستقل و جدا از هم. خاموش‌شدن هم‌زمان همۀ آن چراغ‌ها با فرض الف بسیار محتمل‌تر است تا با فرض ب. بر مبنای ایده‌هایی که هانس رایشنباخِ فیلسوف پایه‌گذاشته است، می‌توان به‌صورت ریاضیاتی، با فرضیاتی که مشخص می‌کنند الف و ب چه می‌گویند، ثابت کرد که مشاهدات از الف در برابر ب حمایت می‌کنند. کسی که کنجکاوی ریاضیاتی دارد، می‌تواند به کتاب من تیغ‌های اوکام؛ راهنمای کاربران۵ (۲۰۱۵) مراجعه کنند.

در این فرضِ چارلز داروین که «همۀ حیاتِ امروزی به یک یا چند نیای اصلی باز می‌گردند» می‌توان مثال زیست‌شناختی مهمی یافت که در آن، علل مشترک بر علت‌های مجزا ترجیح داده می‌شوند. زیست‌شناسان مدرن نیز هنگامی که از جهان‌شمولیِ کد ژنتیکی به‌عنوان شاهدی محکم برای فرضیۀاصل‌ونسب واحد در برابر اصل‌ونسب چندگانه بهره می‌گیرند، در همین مسیر قدم برمی‌دارند. کد مشترک می‌توانست تصادفی بسیار تعجب‌آور باشد، اگر گروه‌های متفاوتِ ارگانیسم‌ها از نقاط شروع متفاوتی آغاز شده بودند. اینکه همۀ حیاتی که امروزه وجود دارد به یک اصل واحد بازمی‌گردد، بسیار محتمل‌تر است.

***

بر مبنای پارادایم سوم صرفه‌جویی، صرفه‌جویی به برآورد اینکه چگونه یک مدل می‌تواند مشاهدات جدید را پیش‌بینی کند نیز مربوط است. یک اصل اساسی در آمار به‌نام «نظریۀ انتخاب مدل»۶ کارِ هیروتوگو آکایک است. او کسی است که با قضیه‌ای تعجب‌آور ثابت کرده است که این ربط وجود دارد. این قضیه مبنای یکی از معیارهای ارزیابی مدل است که اِی.آی.سی۷ نامیده می‌شود. اِی. آی. سی می‌گوید توانایی مدل‌ها برای پیش‌بینی داده‌های تازه را می‌توان اینگونه تخمین زد: با دیدن اینکه سازگاریِ این مدل با داده‌های قدیمی تا چه حد است و همین‌طور با دیدن اینکه چقدر این مدل ساده است.

بگذارید مثالی بزنم. شما در اواخر تابستان در جاده‌ای در حال رانندگی هستید و می‌بینید که دو مزرعۀ بسیار بزرگ ذرت در دو طرف جاده وجود دارند. اتومبیل خود را متوقف می‌کنید و از هر مزرعه صد گیاه ذرت انتخاب می‌کنید. متوجه می‌شوید که طول متوسط در نمونۀ اول ۵۲ اینچ و در نمونۀ دوم ۵۶ اینچ است. ازآنجاکه اواخر فصل رشد ذرت هستیم، فرض می‌کنید که طول متوسط گیاهان این دو مزرعۀ بزرگ در چند روز آینده تغییر نمی‌کند. برنامه‌ریزی می‌کنید که فردا به این دو مزرعه بازگردید و از هر کدام صد گیاه ذرت به‌عنوان نمونه بردارید. فکر می‌کنیدکدام‌یک از این دو پیش‌بینی دقیق‌تر

تخمین‌زدن توانایی مدل‌ها برای پیش‌بینی داده‌های تازه به دو چیز بستگی دارد: یکی میزان سازگاریِ مدل با داده‌های قدیمی و نیز میزان سادگیِ مدل.
خواهد بود؟

پیش‌بینی ۱. صد گیاهی که فردا از مزرعۀ اول انتخاب می‌کنید، طولِ متوسط ۵۲ اینچ خواهند داشت و صد گیاهی که فردا از مزرعۀ دوم انتخاب می‌کنید، طول متوسط ۵۶ اینچ خواهند داشت.

پیش‌بینی ۲. متوسط طول هر دو نمونه ۵۴ اینچ خواهد بود.

نظریۀ انتخاب مدل می‌گوید که این مسئله را می‌توان با درنظرگرفتن این دو مدل از طولِ متوسط در دو جمعیت حل کرد:

۸DIFF: طول متوسط در جمعیت اول = h1 و طول متوسط در جمعیت دوم = h2.

۹NULL: طول متوسط در جمعیت اول = طول متوسط در جمعیت دوم = h.

هیچ‌کدام از این دو مدل ارزش h1، h2 و h را نمی‌گویند. این ارزش‌ها را «پارامترهای انطباق‌پذیر»۱۰ می‌گوییم. مدل NULL این نام را دارد؛ زیرا می‌گوید این دو جمعیت در طول متوسطشان با هم تفاوتی ندارند. نامی که من به مدل DIFF داده‌ام، کمی رهزن است؛ زیرا این مدل نمی‌گوید که دو جمعیت در طول متوسطشان با هم متفاوت‌اند. DIFF این امکان را می‌پذیرد؛ اما این احتمال را نیز می‌پذیرد که دو جمعیت می‌توانند طول متوسط یکسانی داشته باشند.

DIFF و NULL دربارۀ داده‌هایی که فردا به دست می‌آورید، چه پیش‌بینی می‌کند؟ مدل‌ها فی‌نفسه اعداد را فراهم نمی‌آورند. اما شما می‌توانید مدل را با داده‌های قدیمی خود با برآوردکردن ارزش‌های پارامترهای انطباق‌پذیر، یعنی h1، h2 و h در دو مدل تطبیق دهید. نتیجۀ این دو مدل تطبیق‌داده‌شده است:

f (DIFF): h1=52 اینچ، h2=56 اینچ.

f (NULL): h = 54 اینچ.

این پرسش که کدام مدل داده‌های جدید را دقیق‌تر پیش‌بینی خواهد کرد، این‌طور تفسیر شده است: کدام مدل، وقتی با داده‌های قدیمیِ شما تطبیق داده شود، به‌طور دقیق‌تری داده‌های جدیدی را که شما هنوز در اختیار ندارید، پیش‌بینی خواهد کرد؟

ممکن است فکر کنید که DIFF باید درست و NULL باید غلط باشد. احتمال اینکه دو مزرعۀ بزرگ ذرت دقیقاً یک طول متوسط داشته باشند، چقدر است؟ اگر هدف شما این بود که بگویید کدام از این دو مدل درست و کدام غلط است، کار شما تمام شده بود؛ اما مسئله‌ای که با آن مواجهیم، این نیست. بلکه شما می‌خواهید این دو مدل را بر مبنای دقت پیش‌بینی‌شان بسنجید. یکی از حقایق تعجب‌آوردربارۀمدل‌هایی مانند NULL و DIFF این است که مدلی که می‌دانیم غلط است، گاهی پیش‌بینی‌های دقیق‌تری از مدلی که درست است دارد. NULL هرچند غلط است، ممکن است نزدیک به صدق باشد. اگر این‌طور باشد، ممکن است بهتر باشد که از NULL برای پیش‌بینی داده‌های جدید استفاده کنیم تا از DIFF. به‌هرحال داده‌های قدیمی ممکن است نمایندۀ خوبی از جمعیت نباشد! NULL شما را در مسیر مستقیم و محدود نگاه می‌دارد؛ اما DIFFشما را به دورترها می‌برد.

معیار اطلاعات آکایک NULL و DIFF را با درنظر گرفتن دو حقیقت بررسی می‌کند: f (DIFF) بهتر از f (NULL) با داده‌های قدیمی مطابقت دارد و DIFFپیچیده‌تر از NULL است. اینجا پیچیدگی یک مدل تعداد پارامترهای انطباق‌پذیری است که در مدل هست. همان‌طور که گفتم، اِی. آی. سی مبتنی
ترجیح سادگی و پیچیدگی در هنر بر مبنای ذائقه است اما سادگی در علم به ذائقه ربطی ندارد.
است بر قضیۀ آکایک که می‌توان آن را به‌صورت غیرصوری اینطور بیان کرد:

برآوردی غیرجانب‌دارانه از دقت پیش‌بینیِ مدل M = [(M) fچقدر خوب با داده‌های قدیمی تطابق دارد] منهای [تعداد پارامترهای تطابق‌پذیری کهM دربرمی‌گیرد]

بنابراین یک نتیجۀ ریاضیاتی می‌تواند نشان دهد که صرفه‌جویی به برآورد دقتِ پیش‌بینی مربوط است.

قضیۀ آرکایک یک قضیه است و این بدان معناست که از مفروضات به دست آمده است. سه فرض وجود دارد. اولینِ آن‌ها این است که مجموعه‌های قدیمی و جدیدِ داده‌ها از یک واقعیت مشترک به دست آمده‌اند. در مثال ما اگر متوسط طول هر یک از نمونه‌ها هنگام برداشتن نمونه‌های قدیمی و جدید، ثابت بماند، این فرض برآورده شده است. فرض دوم این است که برآوردهای تکرارشده از هر کدام از پارامترها در یک مدل، پراکندگیِ ناقوس‌شکلی ایجاد می‌کند. فرض سوم این است که یکی از مدل‌های بدیل درست است یا به صدق نزدیک است. این فرض در مثال ذرت برآورده شده است؛ زیرا از بین NULL و DIFF حتماً باید یکی درست باشد.

بحث گاودی و مایز نشان می‌دهد که در هنر نمی‌توان بر مبنای ذائقه با دیگران به بحث پرداخت و ترجیح سادگی و پیچیدگی بر مبنای ذائقه است. اینشتین و نیوتن معتقدند که علم متفاوت است. سادگی در علم بحثِ از ذائقه نیست. رایشنباخ و آکایک دلایلی برای این مسئله فراهم آورده‌اند. نتیجه این است که سه پارادایم صرفه‌جویی وجود دارد که توضیح می‌دهد چگونه سادگیِ نظریه می‌تواند به گفتنِ اینکه جهان چگونه است، مربوط باشد:

پارادایم یک: گاهی نظریات ساده‌تر احتمالات بالاتری دارند.

پارادایم دو: گاهی نظریات ساده‌تر را مشاهدات بهتر حمایت می‌کنند.

پارادایم سه: گاهی سادگی مدل مربوط به برآوردکردنِ دقت پیش‌بینیِ آن است.

این سه پارادایم در چیز مهمی مشترک‌اند. اینکه آیا مسئله‌ای خاص مطابق با آن‌ها خواهد بود یا نه بسته به مفروضات تجربی دربارۀ آن مسئله است. آن مفروضات ممکن است دربارۀ برخی مسائل درست باشند و دربارۀ برخی غلط. هرچند صرفه‌جویی آشکارا به شکل‌دادن قضاوت‌ها دربارۀ چگونگی جهان مربوط است، آخرالامر توجیه غیرمشروط و بدون پیش‌فرضی برای تیغ اوکام وجود ندارد.


پی‌نوشت‌ها:
* این مطلب در تاریخ ۳ می ۲۰۱۶ با عنوان Why is simpler better در وب‌سایت ایان منتشر شده است و وب‌سایت ترجمان در تاریخ ۱۵ تیر ۱۳۹۵ این مطلب را با عنوان آیا هرچه نظریۀ علمی ساده‌تر باشد بهتر است؟ ترجمه و منتشر کرده است.
[۱] Ockham's Razor
[۲] parsimony
[۳] Mathematical Principles of Natural Philosophy
[۴] Revelations
[۵] Ockham's Razors: A User's Manual
[۶] model selection theory
[۷] the Akaike Information Criterion
[۸] اشاره به واژۀ different به‌معنای متمایز که DIFF از آن گرفته شده است.
[۹] به معنای صفر، تهی، پوچ
[۱۰] adjustable parameters

کد مطلب: 8054
 


 
محمدی
۱۳۹۵-۰۴-۱۵ ۱۰:۲۰:۲۴
نمی‌دانم بین میس و مایز کدام تلفظ و نگارش درست‌تر است، اما در جامعۀ دانشگاهی معماری، تلفظ میس وندر روهه شناخته شده و مورد توافق است، نه مایز. (778)
 
نیک پور
۱۳۹۵-۰۸-۲۱ ۰۹:۳۷:۴۲
سلام
با تشکر از زحمات شما. اگر امکان دارد قبل از هر مطلبی،قید شود که مطلب بیان شده جزء کدام دانش و ذیل چه رشته ای و تحت کدام سرفصل بحث می شود. این امر هم به خواننده کمک می کند و هم به دسته بندی مطالب ارزشمندی که روی سایت قدار می گیرد کمک می کند. البته بنده فقط از طریق تلگرام مباحث را پیگیری می کنم. (1147)