Подсчитать количество информации, приходящейся на один символ, в тексте естественнонаучного содержания




Лабораторная работа №2

Формула шеннона. Единицы количества информации: вероятностный и объемный подходы

 

Выполнил: студент ФЭУ

Группы УБ(б)-31

года обучения

Проверил:

Матафонова А.Н.

 

 

Хабаровск 2013 г.


План

 

. Подсчитать количество информации, приходящейся на один символ, в тексте экономического содержания

. Подсчитать количество информации, приходящейся на один символ, в тексте технического содержания

. Подсчитать количество информации, приходящейся на один символ, в тексте исторического содержания

. Подсчитать количество информации, приходящейся на один символ, в тексте естественнонаучного содержания

. Подсчитать количество информации, приходящейся на один символ, в художественно-литературном тексте

 


Подсчитать количество информации, приходящейся на один символ, в тексте экономического содержания

 

Организационно-правовые формы предприятий в своей основе определяют форму их собственности, то есть, кому принадлежит предприятие, его основные фонды, оборотные средства, материальные и денежные ресурсы. В зависимости от формы собственности в России в настоящее время различают три основные формы предпринимательской деятельности: частную, коллективную и контрактную.

Указание: составьте таблицу, аналогичную таблице 1, определив вероятность каждого символа в тексте как отношение количества одинаковых символов каждого значения ко всему числу символов в тексте. Затем по формуле Шеннона подсчитайте количество информации, приходящейся на один символ.

 

i Символ Р(i) i Символ P(i) i Символ Р(i)
  Пробел 0,117   М 0,024   Точка 0,005
  О 0,095   П 0,024   Г 0,005
  Е 0,084   Л 0,021   Ж 0,005
  И 0,068   К 0,016   Ч 0,005
  Т 0,068   У 0,016   Х 0,002
  Н 0,065   Я 0,016   Ц 0,002
  Р 0,065   Запятая 0,016   Щ 0.002
  С 0,063   Ф 0,013   Тире 0,002
  В 0,043   Ю 0.013   Двоеточие 0,002
  А 0,038   Ь 0,010   Ё 0,000
  Ы 0,030   Б 0,008   Ш 0,000
  Д 0,024   З 0,008   Ъ 0,000
        Й 0.008   Э 0,000

 


Таблица расчетов к первому заданию в текстовом редакторе Excel

I Р(i) log2Pi Pi*log2Pi i
  0,117486339 -3,095419565 -0,3636695  
  0,095628415 -3,395928676 -0,3247473  
  0,084699454 -3,573466862 -0,3026707  
  0,068306011 -3,878321443 -0,2649127  
  0,068306011 -3,878321443 -0,2649127  
  0,06557377 -3,943416472 -0,2585847  
  0,06557377 -3,943416472 -0,2585847  
  0,06284153 -4,011587974 -0,2520943  
  0,043715847 -4,53951953 -0,1984489  
  0,038251366 -4,717856771 -0,1804645  
  0,030054645 -5,058893689 -0,1520433  
  0,024590164 -5,380821784 -0,1323153  
  0,024590164 -5,380821784 -0,1323153  
  0,024590164 -5,380821784 -0,1323153  
  0,021857923 -5,573466862 -0,1218244  
  0,016393443 -5,965784285 -0,0977997  
  0,016393443 -5,965784285 -0,0977997  
  0,016393443 -5,965784285 -0,0977997  
  0,016393443 -5,965784285 -0,0977997  
  0,013661202 -6,265344567 -0,0855921  
  0,013661202 -6,265344567 -0,0855921  
  0,010928962 -6,64385619 -0,0726105  
  0,008196721 -6,965784285 -0,0570966  
  0,008196721 -6,965784285 -0,0570966  
  0,008196721 -6,965784285 -0,0570966  
  0,005464481 -7,64385619 -0,0417697  
  0,005464481 -7,64385619 -0,0417697  
  0,005464481 -7,64385619 -0,0417697  
  0,005464481 -7,64385619 -0,0417697  
  0,00273224 -8,965784285 -0,0244967  
  0,00273224 -8,965784285 -0,0244967  
  0,00273224 -8,965784285 -0,0244967  
  0,00273224 -8,965784285 -0,0244967  
  0,00273224 -8,965784285 -0,0244967  
  -205,0914626 -4,4357491  

 


Количество информации согласно формуле Шеннона, приходящейся на один символ, в данном тексте H=4.4357, Н ≈ 4,43 бита. Максимальное количество информации, которое могло бы приходиться на один знак в данном тексте, вычисляемое по формуле Хартли, H=log2 367, Н ≈ 8бит.

Подсчитать количество информации, приходящейся на один символ, в тексте технического содержания

информация шеннон символ хартли

Общая технологическая схема изготовления сплавного транзистора напоминает схему изготовления диода, за исключением того, что в полупроводниковую пластинку производят вплавление двух навесок примесей с двух сторон. Вырезанные из монокристалла германия или кремния пластинки шлифуют и травят до необходимой толщины.

i Символ Р(i) i Символ P(i) i Символ Р(i)
  Пробел 0,118   П 0,028   Й 0,006
  О 0,099   Д 0,025   Щ 0,006
  И 0,086   К 0,025   Запятая 0,006
  Н 0,067   Я 0,025   Точка 0,006
  А 0,060   З 0,022   Ф 0,003
  Е 0,060   У 0,022   Ш 0,003
  Т 0,054   Г 0,019   Ё 0,000
  Л 0,047   Х 0.019   Ж 0.000
  В 0,044   Ч 0,009   Ц 0,000
  С 0,041   Ы 0,009   Ъ 0,000
  Р 0,035   Ю 0,009   Ь 0,000
  М 0,028   Б 0.006   Э 0,000

 

Таблица расчетов ко второму заданию в текстовом редакторе Excel

I Р(i) log2Pi Pi*log2Pi i
  0,11821086 -3,0831412 -0,3644608  
  0,09904153 -3,3364277 -0,3304449  
  0,08626198 -3,5395195 -0,305326  
  0,06709265 -3,8996951 -0,2616409  
  0,06070288 -4,0588937 -0,2463865  
  0,06070288 -4,0588937 -0,2463865  
  0,0543131 -4,2108968 -0,2287069  
  0,04792332 -4,4111954 -0,2113991  
  0,04472843 -4,5063527 -0,2015621  
  0,04153355 -4,6082323 -0,1913962  
  0,03514377 -4,8365013 -0,1699729  
  0,02875399 -5,1584294 -0,1483254  
  0,02875399 -5,1584294 -0,1483254  
  0,02555911 -5,3219281 -0,1360237  
  0,02555911 -5,3219281 -0,1360237  
  0,02555911 -5,3219281 -0,1360237  
  0,02236422 -5,5063527 -0,1231453  
  0,02236422 -5,5063527 -0,1231453  
  0,01916933 -5,7178568 -0,1096075  
  0,01916933 -5,7178568 -0,1096075  
  0,00958466 -6,7958593 -0,065136  
  0,00958466 -6,7958593 -0,065136  
  0,00958466 -6,7958593 -0,065136  
  0,00638978 -7,3808218 -0,0471618  
  0,00638978 -7,3808218 -0,0471618  
  0,00638978 -7,3808218 -0,0471618  
  0,00638978 -7,3808218 -0,0471618  
  0,00638978 -7,3808218 -0,0471618  
  0,00319489 -8,3808218 -0,0267758  
  0,00319489 -8,3808218 -0,0267758  
  -167,95804 -4,4034034  

 

Количество информации согласно формуле Шеннона, приходящейся на один символ, в данном тексте H=4.4034, Н ≈ 4,40 бита. Максимальное количество информации, которое могло бы приходиться на один знак в данном тексте, вычисляемое по формуле Хартли, H=log2 313, Н ≈ 8бит.

 


Подсчитать количество информации, приходящейся на один символ, в тексте исторического содержания

С конца пятнадцатого столетия в судьбах Восточной Европы совершается переворот глубокого исторического значения. На сцену истории Европы выступает новая крупная политическая сила - Московское государство. Объединив под своей властью всю северо-восточную Русь, Москва напряженно работает над закреплением добытых политических результатов и во внутренних, и во внешних отношениях.

i Символ Р(i) i Символ P(i) i Символ Р(i)
  Пробел 0,121   У 0,026   Ц 0,007
  О 0,111   Я 0,023   Ш 0,007
  Е 0,071   Л 0,021   Ю 0,007
  С 0,066   Д 0,018   Точка 0,007
  Н 0,060   Х 0,015   Й 0,005
  Т 0,060   Ч 0,015   Тире 0,005
  В 0,058   Б 0,013   Запятая 0,005
  А 0,055   Г 0.013   Ж 0,002
  И 0,055   Ы 0,013   Ъ 0.002
  Р 0,042   Ь 0,010   Ё 0,000
  П 0,029   З 0,007   Ф 0,000
  К 0,026   М 0.007   Щ 0,000
              Э 0,000

 

Таблица расчетов к третьему заданию в текстовом редакторе Excel

I Р(i) log2Pi Pi*log2Pi i
  0,12169312 -3,046921 -0,3707893  
  0,11111111 -3,1713684 -0,3523743  
  0,07142857 -3,8160372 -0,2725741  
  0,06613757 -3,9213902 -0,2593512  
  0,06084656 -4,0588937 -0,2469697  
  0,06084656 -4,0588937 -0,2469697  
  0,05820106 -4,1078033 -0,2390785  
  0,05555556 -4,1844246 -0,232468  
  0,05555556 -4,1844246 -0,232468  
  0,04232804 -4,5734669 -0,1935859  
  0,02910053 -5,1078033 -0,1486398  
  0,02645503 -5,2653446 -0,1392948  
  0,02645503 -5,2653446 -0,1392948  
  0,02380952 -5,4422223 -0,1295767  
  0,02116402 -5,5734669 -0,117957  
  0,01851852 -5,7958593 -0,1073307  
  0,01587302 -6,0588937 -0,0961729  
  0,01587302 -6,0588937 -0,0961729  
  0,01322751 -6,2653446 -0,0828749  
  0,01322751 -6,2653446 -0,0828749  
  0,01322751 -6,2653446 -0,0828749  
  0,01058201 -6,6438562 -0,0703054  
  0,00793651 -7,1584294 -0,0568129  
  0,00793651 -7,1584294 -0,0568129  
  0,00793651 -7,1584294 -0,0568129  
  0,00793651 -7,1584294 -0,0568129  
  0,00793651 -7,1584294 -0,0568129  
  0,00793651 -7,1584294 -0,0568129  
  0,00529101 -7,6438562 -0,0404437  
  0,00529101 -7,6438562 -0,0404437  
  0,00529101 -7,6438562 -0,0404437  
  0,0026455 -8,9657843 -0,023719  
  0,0026455 -8,9657843 -0,023719  
  -192,94505 -4,4496453  

 

Количество информации согласно формуле Шеннона, приходящейся на один символ, в данном тексте H=4.4496, Н ≈ 4,44 бита. Максимальное количество информации, которое могло бы приходиться на один знак в данном тексте, вычисляемое по формуле Хартли, H=log2 378, Н ≈ 8бит.

 

Подсчитать количество информации, приходящейся на один символ, в тексте естественнонаучного содержания

 

Новые данные о физиологической потребности организма человека в пищевых веществах и энергии, а также выяснение закономерностей ассимиляции пищи в условиях нарушенного болезнью обмена веществ на всех этапах метаболического конвейера позволили максимально сбалансировать химический состав диет и их энергетическую ценность.

i Символ Р(i) i Символ P(i) i Символ Р(i)
  Пробел 0,119   Р 0,025   Э 0,009
  Е 0,097   Х 0,021   Я 0,009
  И 0,090   Г 0,018   Д 0,006
  О 0,084   Б 0,015   Ц 0,006
  А 0,068   З 0,015   Ю 0,006
  Н 0,068   П 0,015   Ж 0,003
  С 0,059   Ч 0,015   Ф 0.003
  В 0,050   Й 0.012   Ш 0,003
  Т 0,040   Щ 0,012   Запятая 0,003
  Л 0,031   Ы 0,012   Точка 0,003
  К 0,028   Ь 0,012   Ё 0,000
  М 0,025   У 0.009   Ъ 0,000

 

Таблица расчетов к четвертому заданию в текстовом редакторе Excel

I Р(i) log2Pi Pi*log2Pi i
  0,11838006 -3,0831412 -0,3649825  
  0,09657321 -3,3808218 -0,3264968  
  0,09034268 -3,4739312 -0,3138443  
  0,08411215 -3,5734669 -0,300572  
  0,06853583 -3,8783214 -0,265804  
  0,06853583 -3,8783214 -0,265804  
  0,05919003 -4,0831412 -0,2416813  
  0,04984424 -4,3510744 -0,216876  
  0,04049844 -4,6438562 -0,1880689  
  0,03115265 -5,011588 -0,1561242  
  0,02803738 -5,1584294 -0,1446289  
  0,02492212 -5,3808218 -0,1341015  
  0,02492212 -5,3808218 -0,1341015  
  0,02180685 -5,5734669 -0,1215398  
  0,01869159 -5,7958593 -0,1083338  
  0,01557632 -6,0588937 -0,0943753  
  0,01557632 -6,0588937 -0,0943753  
  0,01557632 -6,0588937 -0,0943753  
  0,01557632 -6,0588937 -0,0943753  
  0,01246106 -6,3808218 -0,0795118  
  0,01246106 -6,3808218 -0,0795118  
  0,01246106 -6,3808218 -0,0795118  
  0,01246106 -6,3808218 -0,0795118  
  0,00934579 -6,7958593 -0,0635127  
  0,00934579 -6,7958593 -0,0635127  
  0,00934579 -6,7958593 -0,0635127  
  0,00623053 -7,3808218 -0,0459864  
  0,00623053 -7,3808218 -0,0459864  
  0,00623053 -7,3808218 -0,0459864  
  0,00311526 -8,3808218 -0,0261085  
  0,00311526 -8,3808218 -0,0261085  
  0,00311526 -8,3808218 -0,0261085  
  0,00311526 -8,3808218 -0,0261085  
  0,00311526 -8,3808218 -0,0261085  
  -200,84008 -4,4375474  

 

Количество информации согласно формуле Шеннона, приходящейся на один символ, в данном тексте H=4.4375, Н ≈ 4,43 бита. Максимальное количество информации, которое могло бы приходиться на один знак в данном тексте, вычисляемое по формуле Хартли, H=log2 321, Н ≈ 8бит.

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2020-03-31 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: