Лабораторная работа №2
Формула шеннона. Единицы количества информации: вероятностный и объемный подходы
Выполнил: студент ФЭУ
Группы УБ(б)-31
года обучения
Проверил:
Матафонова А.Н.
Хабаровск 2013 г.
План
. Подсчитать количество информации, приходящейся на один символ, в тексте экономического содержания
. Подсчитать количество информации, приходящейся на один символ, в тексте технического содержания
. Подсчитать количество информации, приходящейся на один символ, в тексте исторического содержания
. Подсчитать количество информации, приходящейся на один символ, в тексте естественнонаучного содержания
. Подсчитать количество информации, приходящейся на один символ, в художественно-литературном тексте
Подсчитать количество информации, приходящейся на один символ, в тексте экономического содержания
Организационно-правовые формы предприятий в своей основе определяют форму их собственности, то есть, кому принадлежит предприятие, его основные фонды, оборотные средства, материальные и денежные ресурсы. В зависимости от формы собственности в России в настоящее время различают три основные формы предпринимательской деятельности: частную, коллективную и контрактную.
Указание: составьте таблицу, аналогичную таблице 1, определив вероятность каждого символа в тексте как отношение количества одинаковых символов каждого значения ко всему числу символов в тексте. Затем по формуле Шеннона подсчитайте количество информации, приходящейся на один символ.
i | Символ | Р(i) | i | Символ | P(i) | i | Символ | Р(i) |
Пробел | 0,117 | М | 0,024 | Точка | 0,005 | |||
О | 0,095 | П | 0,024 | Г | 0,005 | |||
Е | 0,084 | Л | 0,021 | Ж | 0,005 | |||
И | 0,068 | К | 0,016 | Ч | 0,005 | |||
Т | 0,068 | У | 0,016 | Х | 0,002 | |||
Н | 0,065 | Я | 0,016 | Ц | 0,002 | |||
Р | 0,065 | Запятая | 0,016 | Щ | 0.002 | |||
С | 0,063 | Ф | 0,013 | Тире | 0,002 | |||
В | 0,043 | Ю | 0.013 | Двоеточие | 0,002 | |||
А | 0,038 | Ь | 0,010 | Ё | 0,000 | |||
Ы | 0,030 | Б | 0,008 | Ш | 0,000 | |||
Д | 0,024 | З | 0,008 | Ъ | 0,000 | |||
Й | 0.008 | Э | 0,000 |
|
Таблица расчетов к первому заданию в текстовом редакторе Excel
I | Р(i) | log2Pi | Pi*log2Pi | i |
0,117486339 | -3,095419565 | -0,3636695 | ||
0,095628415 | -3,395928676 | -0,3247473 | ||
0,084699454 | -3,573466862 | -0,3026707 | ||
0,068306011 | -3,878321443 | -0,2649127 | ||
0,068306011 | -3,878321443 | -0,2649127 | ||
0,06557377 | -3,943416472 | -0,2585847 | ||
0,06557377 | -3,943416472 | -0,2585847 | ||
0,06284153 | -4,011587974 | -0,2520943 | ||
0,043715847 | -4,53951953 | -0,1984489 | ||
0,038251366 | -4,717856771 | -0,1804645 | ||
0,030054645 | -5,058893689 | -0,1520433 | ||
0,024590164 | -5,380821784 | -0,1323153 | ||
0,024590164 | -5,380821784 | -0,1323153 | ||
0,024590164 | -5,380821784 | -0,1323153 | ||
0,021857923 | -5,573466862 | -0,1218244 | ||
0,016393443 | -5,965784285 | -0,0977997 | ||
0,016393443 | -5,965784285 | -0,0977997 | ||
0,016393443 | -5,965784285 | -0,0977997 | ||
0,016393443 | -5,965784285 | -0,0977997 | ||
0,013661202 | -6,265344567 | -0,0855921 | ||
0,013661202 | -6,265344567 | -0,0855921 | ||
0,010928962 | -6,64385619 | -0,0726105 | ||
0,008196721 | -6,965784285 | -0,0570966 | ||
0,008196721 | -6,965784285 | -0,0570966 | ||
0,008196721 | -6,965784285 | -0,0570966 | ||
0,005464481 | -7,64385619 | -0,0417697 | ||
0,005464481 | -7,64385619 | -0,0417697 | ||
0,005464481 | -7,64385619 | -0,0417697 | ||
0,005464481 | -7,64385619 | -0,0417697 | ||
0,00273224 | -8,965784285 | -0,0244967 | ||
0,00273224 | -8,965784285 | -0,0244967 | ||
0,00273224 | -8,965784285 | -0,0244967 | ||
0,00273224 | -8,965784285 | -0,0244967 | ||
0,00273224 | -8,965784285 | -0,0244967 | ||
∑ | -205,0914626 | -4,4357491 |
|
Количество информации согласно формуле Шеннона, приходящейся на один символ, в данном тексте H=4.4357, Н ≈ 4,43 бита. Максимальное количество информации, которое могло бы приходиться на один знак в данном тексте, вычисляемое по формуле Хартли, H=log2 367, Н ≈ 8бит.
Подсчитать количество информации, приходящейся на один символ, в тексте технического содержания
информация шеннон символ хартли
Общая технологическая схема изготовления сплавного транзистора напоминает схему изготовления диода, за исключением того, что в полупроводниковую пластинку производят вплавление двух навесок примесей с двух сторон. Вырезанные из монокристалла германия или кремния пластинки шлифуют и травят до необходимой толщины.
i | Символ | Р(i) | i | Символ | P(i) | i | Символ | Р(i) |
Пробел | 0,118 | П | 0,028 | Й | 0,006 | |||
О | 0,099 | Д | 0,025 | Щ | 0,006 | |||
И | 0,086 | К | 0,025 | Запятая | 0,006 | |||
Н | 0,067 | Я | 0,025 | Точка | 0,006 | |||
А | 0,060 | З | 0,022 | Ф | 0,003 | |||
Е | 0,060 | У | 0,022 | Ш | 0,003 | |||
Т | 0,054 | Г | 0,019 | Ё | 0,000 | |||
Л | 0,047 | Х | 0.019 | Ж | 0.000 | |||
В | 0,044 | Ч | 0,009 | Ц | 0,000 | |||
С | 0,041 | Ы | 0,009 | Ъ | 0,000 | |||
Р | 0,035 | Ю | 0,009 | Ь | 0,000 | |||
М | 0,028 | Б | 0.006 | Э | 0,000 |
Таблица расчетов ко второму заданию в текстовом редакторе Excel
I | Р(i) | log2Pi | Pi*log2Pi | i |
0,11821086 | -3,0831412 | -0,3644608 | ||
0,09904153 | -3,3364277 | -0,3304449 | ||
0,08626198 | -3,5395195 | -0,305326 | ||
0,06709265 | -3,8996951 | -0,2616409 | ||
0,06070288 | -4,0588937 | -0,2463865 | ||
0,06070288 | -4,0588937 | -0,2463865 | ||
0,0543131 | -4,2108968 | -0,2287069 | ||
0,04792332 | -4,4111954 | -0,2113991 | ||
0,04472843 | -4,5063527 | -0,2015621 | ||
0,04153355 | -4,6082323 | -0,1913962 | ||
0,03514377 | -4,8365013 | -0,1699729 | ||
0,02875399 | -5,1584294 | -0,1483254 | ||
0,02875399 | -5,1584294 | -0,1483254 | ||
0,02555911 | -5,3219281 | -0,1360237 | ||
0,02555911 | -5,3219281 | -0,1360237 | ||
0,02555911 | -5,3219281 | -0,1360237 | ||
0,02236422 | -5,5063527 | -0,1231453 | ||
0,02236422 | -5,5063527 | -0,1231453 | ||
0,01916933 | -5,7178568 | -0,1096075 | ||
0,01916933 | -5,7178568 | -0,1096075 | ||
0,00958466 | -6,7958593 | -0,065136 | ||
0,00958466 | -6,7958593 | -0,065136 | ||
0,00958466 | -6,7958593 | -0,065136 | ||
0,00638978 | -7,3808218 | -0,0471618 | ||
0,00638978 | -7,3808218 | -0,0471618 | ||
0,00638978 | -7,3808218 | -0,0471618 | ||
0,00638978 | -7,3808218 | -0,0471618 | ||
0,00638978 | -7,3808218 | -0,0471618 | ||
0,00319489 | -8,3808218 | -0,0267758 | ||
0,00319489 | -8,3808218 | -0,0267758 | ||
∑ | -167,95804 | -4,4034034 |
|
Количество информации согласно формуле Шеннона, приходящейся на один символ, в данном тексте H=4.4034, Н ≈ 4,40 бита. Максимальное количество информации, которое могло бы приходиться на один знак в данном тексте, вычисляемое по формуле Хартли, H=log2 313, Н ≈ 8бит.
Подсчитать количество информации, приходящейся на один символ, в тексте исторического содержания
С конца пятнадцатого столетия в судьбах Восточной Европы совершается переворот глубокого исторического значения. На сцену истории Европы выступает новая крупная политическая сила - Московское государство. Объединив под своей властью всю северо-восточную Русь, Москва напряженно работает над закреплением добытых политических результатов и во внутренних, и во внешних отношениях.
i | Символ | Р(i) | i | Символ | P(i) | i | Символ | Р(i) |
Пробел | 0,121 | У | 0,026 | Ц | 0,007 | |||
О | 0,111 | Я | 0,023 | Ш | 0,007 | |||
Е | 0,071 | Л | 0,021 | Ю | 0,007 | |||
С | 0,066 | Д | 0,018 | Точка | 0,007 | |||
Н | 0,060 | Х | 0,015 | Й | 0,005 | |||
Т | 0,060 | Ч | 0,015 | Тире | 0,005 | |||
В | 0,058 | Б | 0,013 | Запятая | 0,005 | |||
А | 0,055 | Г | 0.013 | Ж | 0,002 | |||
И | 0,055 | Ы | 0,013 | Ъ | 0.002 | |||
Р | 0,042 | Ь | 0,010 | Ё | 0,000 | |||
П | 0,029 | З | 0,007 | Ф | 0,000 | |||
К | 0,026 | М | 0.007 | Щ | 0,000 | |||
Э | 0,000 |
Таблица расчетов к третьему заданию в текстовом редакторе Excel
I | Р(i) | log2Pi | Pi*log2Pi | i |
0,12169312 | -3,046921 | -0,3707893 | ||
0,11111111 | -3,1713684 | -0,3523743 | ||
0,07142857 | -3,8160372 | -0,2725741 | ||
0,06613757 | -3,9213902 | -0,2593512 | ||
0,06084656 | -4,0588937 | -0,2469697 | ||
0,06084656 | -4,0588937 | -0,2469697 | ||
0,05820106 | -4,1078033 | -0,2390785 | ||
0,05555556 | -4,1844246 | -0,232468 | ||
0,05555556 | -4,1844246 | -0,232468 | ||
0,04232804 | -4,5734669 | -0,1935859 | ||
0,02910053 | -5,1078033 | -0,1486398 | ||
0,02645503 | -5,2653446 | -0,1392948 | ||
0,02645503 | -5,2653446 | -0,1392948 | ||
0,02380952 | -5,4422223 | -0,1295767 | ||
0,02116402 | -5,5734669 | -0,117957 | ||
0,01851852 | -5,7958593 | -0,1073307 | ||
0,01587302 | -6,0588937 | -0,0961729 | ||
0,01587302 | -6,0588937 | -0,0961729 | ||
0,01322751 | -6,2653446 | -0,0828749 | ||
0,01322751 | -6,2653446 | -0,0828749 | ||
0,01322751 | -6,2653446 | -0,0828749 | ||
0,01058201 | -6,6438562 | -0,0703054 | ||
0,00793651 | -7,1584294 | -0,0568129 | ||
0,00793651 | -7,1584294 | -0,0568129 | ||
0,00793651 | -7,1584294 | -0,0568129 | ||
0,00793651 | -7,1584294 | -0,0568129 | ||
0,00793651 | -7,1584294 | -0,0568129 | ||
0,00793651 | -7,1584294 | -0,0568129 | ||
0,00529101 | -7,6438562 | -0,0404437 | ||
0,00529101 | -7,6438562 | -0,0404437 | ||
0,00529101 | -7,6438562 | -0,0404437 | ||
0,0026455 | -8,9657843 | -0,023719 | ||
0,0026455 | -8,9657843 | -0,023719 | ||
∑ | -192,94505 | -4,4496453 |
Количество информации согласно формуле Шеннона, приходящейся на один символ, в данном тексте H=4.4496, Н ≈ 4,44 бита. Максимальное количество информации, которое могло бы приходиться на один знак в данном тексте, вычисляемое по формуле Хартли, H=log2 378, Н ≈ 8бит.
Подсчитать количество информации, приходящейся на один символ, в тексте естественнонаучного содержания
Новые данные о физиологической потребности организма человека в пищевых веществах и энергии, а также выяснение закономерностей ассимиляции пищи в условиях нарушенного болезнью обмена веществ на всех этапах метаболического конвейера позволили максимально сбалансировать химический состав диет и их энергетическую ценность.
i | Символ | Р(i) | i | Символ | P(i) | i | Символ | Р(i) |
Пробел | 0,119 | Р | 0,025 | Э | 0,009 | |||
Е | 0,097 | Х | 0,021 | Я | 0,009 | |||
И | 0,090 | Г | 0,018 | Д | 0,006 | |||
О | 0,084 | Б | 0,015 | Ц | 0,006 | |||
А | 0,068 | З | 0,015 | Ю | 0,006 | |||
Н | 0,068 | П | 0,015 | Ж | 0,003 | |||
С | 0,059 | Ч | 0,015 | Ф | 0.003 | |||
В | 0,050 | Й | 0.012 | Ш | 0,003 | |||
Т | 0,040 | Щ | 0,012 | Запятая | 0,003 | |||
Л | 0,031 | Ы | 0,012 | Точка | 0,003 | |||
К | 0,028 | Ь | 0,012 | Ё | 0,000 | |||
М | 0,025 | У | 0.009 | Ъ | 0,000 |
Таблица расчетов к четвертому заданию в текстовом редакторе Excel
I | Р(i) | log2Pi | Pi*log2Pi | i |
0,11838006 | -3,0831412 | -0,3649825 | ||
0,09657321 | -3,3808218 | -0,3264968 | ||
0,09034268 | -3,4739312 | -0,3138443 | ||
0,08411215 | -3,5734669 | -0,300572 | ||
0,06853583 | -3,8783214 | -0,265804 | ||
0,06853583 | -3,8783214 | -0,265804 | ||
0,05919003 | -4,0831412 | -0,2416813 | ||
0,04984424 | -4,3510744 | -0,216876 | ||
0,04049844 | -4,6438562 | -0,1880689 | ||
0,03115265 | -5,011588 | -0,1561242 | ||
0,02803738 | -5,1584294 | -0,1446289 | ||
0,02492212 | -5,3808218 | -0,1341015 | ||
0,02492212 | -5,3808218 | -0,1341015 | ||
0,02180685 | -5,5734669 | -0,1215398 | ||
0,01869159 | -5,7958593 | -0,1083338 | ||
0,01557632 | -6,0588937 | -0,0943753 | ||
0,01557632 | -6,0588937 | -0,0943753 | ||
0,01557632 | -6,0588937 | -0,0943753 | ||
0,01557632 | -6,0588937 | -0,0943753 | ||
0,01246106 | -6,3808218 | -0,0795118 | ||
0,01246106 | -6,3808218 | -0,0795118 | ||
0,01246106 | -6,3808218 | -0,0795118 | ||
0,01246106 | -6,3808218 | -0,0795118 | ||
0,00934579 | -6,7958593 | -0,0635127 | ||
0,00934579 | -6,7958593 | -0,0635127 | ||
0,00934579 | -6,7958593 | -0,0635127 | ||
0,00623053 | -7,3808218 | -0,0459864 | ||
0,00623053 | -7,3808218 | -0,0459864 | ||
0,00623053 | -7,3808218 | -0,0459864 | ||
0,00311526 | -8,3808218 | -0,0261085 | ||
0,00311526 | -8,3808218 | -0,0261085 | ||
0,00311526 | -8,3808218 | -0,0261085 | ||
0,00311526 | -8,3808218 | -0,0261085 | ||
0,00311526 | -8,3808218 | -0,0261085 | ||
∑ | -200,84008 | -4,4375474 |
Количество информации согласно формуле Шеннона, приходящейся на один символ, в данном тексте H=4.4375, Н ≈ 4,43 бита. Максимальное количество информации, которое могло бы приходиться на один знак в данном тексте, вычисляемое по формуле Хартли, H=log2 321, Н ≈ 8бит.