به اندازه‌ی یک قاشق چای‌خوری صحبت از تئوری اطلاعات

قبلا در مورد سکه‌ای صحبت کردم که شانس شیر یا خط اومدن‌اش برابر نبود. در اون جا گفتم که احتمالا برای انتخاب یک نفر از دو نفر با استفاده از این سکه یک بار انداختن سکه کافی نیست.

به طور کلی اطلاعات یک واقعه رو متناسب با احتمال رخ دادن اون واقعه تعریف می‌کنن به این ترتیب که هر چه قدر احتمال رخ دادن کم‌تر باشه، اطلاعات اون رخ‌داد بیش‌تر بوده. مثلا به این مثال توجه کنین(۱): در یک کیسه ده توپ داریم با شماره‌های صفر تا نه. توپ شماره صفر سبز رنگه و بقیه‌ی توپ‌ها قرمز رنگ هستند. اگر یک نفر به داخل کیسه دست ببره و یک توپ در بیاره و بگه که رنگش قرمزه، نتیجه‌ای که می‌شه گرفت اینه که عدد روی توپ عددی بوده بین یک تا نه. ولی اگر بگه که رنگ توپ سبزه، به قطع می‌تونیم بگیم که عدد روی توپ صفره. یعنی وقتی که رنگ توپ قرمز بود، اطلاعات خیلی کم‌تری منتقل شد به نسبت وقتی که رنگ توپ سبز بود.

اطلاعات یک واقعه با احتمال p رو برابر با

-log p

تعریف می‌کنند (مثلا در مبنای دو. در این متن تمام لگاریتم‌ها در مبنای دو هستند). در نتیجه در مثالی که گفتیم اطلاعات موجود در بیرون کشیده شدن توپ سبز برابر با

-log 0.1 = 3.32192809

بود در حالی که اطلاعات موجود در بیرون کشیده شدن توپ قرمز برابر با

-log 0.9 = 0.152003093

بود. با این ترتیب برای سکه‌ای که شانس برابر نداشته باشه، فرض کنین که احتمال اومدن شیر برابر با p باشه (و در نتیجه خط برابر با 1-p خواهد بود). با توجه به این که هر کدوم احتمال رخ دادن خودش رو داره و در صورت اتفاق افتادن هر کدوم یک مقدار اطلاعات منتقل شده، پس اطلاعاتی که از یک بار انداختن اون سکه حاصل می‌شه برابره با:

-p*log p – (1-p)*log 1-p

حالا اگر بخواهیم این شکل رو رسم کنیم، می‌تونیم نمودار اطلاعات رو بر اساس احتمال اومدن شیر بکشیم که این شکلی می‌شه (۲):

که به این معناست که اگر احتمال اومدن شیر یک‌دوم باشه، بیش‌ترین اطلاعات از انداختن سکه حاصل می‌شه و هرچه قدر که سکه به سمت ناعادلانه شدن پیش‌تر می‌ره، اطلاعات حاصل از انداختن هربار سکه کم‌تر می‌شه.

منتظر مطالب بعدی باشید!

(۱) این مثال رو از کتاب Dynamics of Complex Systems گرفتم.
(۲) شکل رو در این‌جا ساختم: http://www.walterzorn.com/grapher/grapher_e.htm