Вы на НеОфициальном сайте факультета ЭиП

На нашем портале ежедневно выкладываются материалы способные помочь студентам. Курсовые, шпаргалки, ответы и еще куча всего что может понадобиться в учебе!
Главная Контакты Карта сайта
 
Где мы?

Реклама


Информация и её свойства

Просмотров: 4382 Автор: admin
существование области и предмета информатики немыслима без ее основного ресурса – информации. понимания информации как один из основных стратегических ресурсов общества, необходимо уметь его оценить как с качественной, так и с количественной стороны. на этом пути существуют большие проблемы из-за нематериальной природы этого ресурса и субъективности восприятия конкретной информации различными людьми.
цель данной лекции ознакомить с тем, что информацию можно оценить как на качественном, так на количественном уровне, и для этого вводятся специальные меры, что для успешной обработки информацию необходимо систематизировать, проводя ее классификацию и кодирование.
1. понятие информации
термин информация произошел от латинского слова informatio – что означает разъяснение, изложение, и первоначально под ним понимали сведения, передаваемые людьми устным, письменным, или, например, с помощью условных сигналов. с середины хх века понятие информации становится общенаучным понятие, включающим обмен сведениями между людьми, человеком и автоматом, автоматом и автоматом, обмен сигналами в животном и растительном мире, передачу признаков от клетки к клетке, от организма к организму, а также одним из основных понятий кибернетики.
однако понятие информация – это настолько общее и глубокое понятие, что его нельзя объяснить одной фразой. в это слово вкладывается различный смысл в технике, науке и в житейских ситуациях.
в обычном понимании под информацией понимают любые данные или сведения, которые кого-либо интересуют. например, сообщение о каких-либо событиях, о чьей-либо деятельности и в этом смысле означает "сообщить нечто, неизвестное раньше".
информация в процессе практической деятельности человека это сведения об объектах и явлениях окружающей среды, их параметрах, свойствах и состоянии. например, цвет, запах, шум и т.п.
в природе информацией является генетический код заложенный в каждом живом организме.
как мы видим из примеров объединить все эти понятия в единое целое практически невозможно. однако можно определить общие критерии, что понимается под информацией:
· во-первых, сообщение, ознакомление, осведомление о положении дел, либо сведений о чем-либо, передаваемых людьми;
· во-вторых, сообщение, уменьшающее или снимающее неопределенность в результате его получения;
· в-третьих, сообщение, неразрывно связанное с практической деятельностью человека;
· в-четвертых, передачу, отражение, разнообразие в любых объектах и процессах (неживой и живой природы).
поэтому, в широком смысле «информация» – это отражение реального мира; в узком смысле «информация» – это любые сведения, являющиеся объектом хранения, передачи и преобразования.
довольно таки распространенным является и взгляд на информацию как на ресурс, аналогичный материальным, трудовым и денежным ресурсам. с этой точки зрения «информация» – новые сведения, позволяющие улучшить процессы, связанные с преобразованием веществ, энергии и самой информации. и характерное отличие от всех остальных ресурсов – чем больше используют информации тем больше становится ее.
перейдем теперь к характеристикам информации. можно выделить три фазы (формы) существования информации:
- ассимилированная информация – представления сообщений в сознании человека, наложенное на систему его понятий и оценок;
- документированная (статическая) информация – сведения зафиксированные в знаковой форме на каком-то физическом носителе (книги, рисунки, записи и т.д.);
- передаваемая информация (динамическая) – сведения, рассматриваемые в момент передачи информации по средствам связи или в пространстве от источника к приемнику.
информацию можно разделим на два вида: биологическую и социальную. биологическая информация обеспечивает жизнедеятельность отдельно взятого живого организма. к разновидностям биологической информации относится генетическая информация. генетическая информация – это получаемая от предков и заложенные в наследственных структурах организмов в виде совокупности генов программы составе, строении и характере обмена составляющих организм веществ.
социальная информация неразрывно связана с практической деятельностью человека, поэтому можно выделить столько типов и разновидностей, сколько имеется видов деятельности человека. например, юридическая, научная, техническая, экономическая, финансовая и т.д.
свойства и функции информации.
выделим следующие основные качества информации:
- достоверность;
- полнота;
- ценность;
- своевременность;
- понятность;
- доступность;
- краткость.
результат анализа различных информационных материалов дает право остановиться на следующих основных функциях, которыми обладает информация:
- отражательная функция, состоящая в том, что информация содержит сведения, характеризующие свойства какого-либо объекта;
- гносеологическая функция, осуществляющая с помощью информации процесс познания в науках;
- эвристическая функция, позволяющая с помощью информации осуществлять поиск нового, делать открытия;
- учебно-познавательная функция, дающая возможность использовать в учебном процессе накопленную информацию, воплощенную в учебниках и в другой литературе, а для учащегося это будет приобщение к знаниям, их усвоения, то есть познавательный процесс;
- организационная функция состоит в том, что информация направляет деятельность человека, коллектива в определенное русло, обеспечивает единство действий, то есть, как бы организует людей в их работе.
перечислим что можно делать с информацией, ее можно: создавать, передавать, воспринимать, использовать, запоминать, принимать, копировать, формализовать, распространять, преобразовывать, комбинировать, обрабатывать, делить на части, упрощать, собирать, хранить, искать, измерять, разрушать и др.
1.2. информация и ее свойства в информатике.
информатика рассматривает информацию, как концептуально связанные между собой сведения, данные, понятия, изменяющие наши представления о явлении или объекте окружающего мира. наряду с информацией в информатике часто употребляется понятие данные.
данные – диалектическая составная часть информации. они представляют собой зарегистрированные сигналы. при этом физический метод регистрации может быть любым: механическое перемещение физических тел, изменение их формы или параметров качества поверхности, изменение электрических, магнитных, оптических характеристик, химического состава и (или) характера химических связей, изменение состояния электронной системы и многое другое. в соответствии с методом регистрации данные могут храниться и транспортироваться на носителях различных видов. самым распространенным носителем данных, хотя и не самым экономичным является бумага. на бумаге данные регистрируются путем изменения оптических характеристик ее поверхности. изменение оптических свойств (изменение коэффициента отражения поверхности в определенном диапазоне длин волн) используется также в устройствах, осуществляющих запись лазерным лучом на пластмассовых носителях с отражающим покрытием (сd-rом). в качестве носителей, использующих изменение магнитных свойств, можно назвать магнитные ленты и диски. регистрация данных путем изменения химического состава поверхностных веществ носителя широко используется в фотографии. на биохимическом уровне происходит накопление и передача данных в живой природе.
носители данных интересуют нас не сами по себе, а постольку, поскольку свойства информации весьма тесно связаны со свойствами ее носителей. любой носитель можно характеризовать параметром разрешающей способности (количеством данных, записанных в принятой для носителя единице измерения) и динамическим диапазоном (логарифмическим отношением интенсивности амплитуд максимального и минимального регистрируемого сигналов). от этих свойств носителя нередко зависят такие свойства информации, как полнота, доступность и достоверность.
понятия информация и данные тесно связаны между собой и с методом обработки. примером может служить прослушивание передачи на незнакомом языке. мы регистрируем, записываем, данные, но не знаем, что принимаем, но взяв словарик переводим, применяем метод обработки данных, и получаем информацию. данные несут в себе информацию о событиях. однако эти два понятия не тождественны. сформулируем: информация – это продукт взаимодействия данных и адекватных им методов.
рассмотрим взаимосвязь между данными и информацией на приведенном примере.
запись принимаемого текста
словарик для перевода, как метод замены иностранных слов на русские слова
результат перевода – получение текста с информацией.

с точки зрения информатики наиболее важными представляются следующие свойства информации.

объективность и субъективность информации. понятие объективности информации является относительным. это понятно, если учесть, что методы являются субъективными. более объективной принято считать ту информацию, в которую методы вносят меньший субъективный элемент. так, например, принято считать, что в результате наблюдения фотоснимка природного объекта или явления образуется более объективная информация, чем в результате наблюдения рисунка того же объекта, выполненного человеком. в ходе информационного процесса степень объективности информации всегда понижается. это свойство учитывают, например, в правовых дисциплинах, где по-разному обрабатываются показания лиц, непосредственно наблюдавших события или получивших информацию косвенным путем (посредством умозаключений или со слов третьих лиц). в не меньшей степени объективность информации учитывают в исторических дисциплинах. одни и те же события, зафиксированные в исторических документах разных стран и народов, выглядят совершенно по-разному. у историков имеются свои методы для тестирования объективности исторических данных и создания новых, более достоверных данных путем сопоставления, фильтрации и селекции исходных данных. обратим внимание на то, что здесь речь идет не о повышении объективности данных, а о повышении их достоверности (это совсем другое свойство).
адекватность информации наиболее важная характеристика информации для потребителя, это определенный уровень соответствия создаваемого с помощью полученной информации образа реальному объекту, процессу, явлению. (степень соответствия реальному объективному состоянию дела.)
в реальной жизни вряд ли возможна ситуация, когда вы сможете рассчитывать на полную адекватность информации. всегда присутствует некоторая степень неопределенности т.е. неполной или недостоверной информации. от степени адекватности информации реальному состоянию объекта или процесса зависит правильность принятия решений человеком.
например. вы успешно закончили школу и хотите продолжить образование по экономическому направлению. поговорив с друзьями, вы узнаете, что подобную подготовку можно получить в разных вузах. в результате таких бесед вы получаете весьма разноречивые сведения, которые не позволяют вам принять решение в пользу того или иного варианта, т.е. полученная информация неадекватна реальному состоянию дел. для того чтобы получить более достоверные сведения, вы покупаете справочник для поступающих в вузы, из которого получаете исчерпывающую информацию. в этом случае можно говорить, что информация, полученная вами из справочника, адекватно отражает, направления обучения в вузах и помогает вам определиться в окончательном выборе.
формы адекватности информации. адекватность информации может выражаться в трех формах: семантической, синтаксической, прагматической.
синтаксическая адекватность. она отображает формально-структурные характеристики информации и не затрагивает ее смыслового содержания. на синтаксическом уровне учитываются тип носителя и способ представления информации, скорость передачи и обработки, размеры кодов представления информации, надежность и точность преобразования этих кодов и т.п. информацию, рассматриваемую только с синтаксических позиций, обычно называют данными, так как при этом не имеет значения смысловая сторона. эта форма способствует восприятию внешних структурных характеристик, т.е. синтаксической стороны информации.
семантическая (смысловая) адекватность. эта форма определяет степень соответствия образа объекта и самого объекта. семантический аспект предполагает учет смыслового содержания информации. на этом уровне анализируются те сведения, которые отражает информация, рассматриваются смысловые связи. в информатике устанавливаются смысловые связи между кодами представления информации. эта форма служит для формирования понятий и представлений, выявления смысла, содержания информации и ее обобщения.
прагматическая (потребительская) адекватность. она отражает отношение информации и ее потребителя, соответствие информации цели управления, которая на ее основе реализуется. проявляются прагматические свойства информации только при наличии единства информации (объекта), пользователя и цели управления. прагматический аспект рассмотрения связан с ценностью, полезностью использования информации при выработке потребителем решения для достижения своей цели. с этой точки зрения анализируются потребительские свойства информации. эта форма адекватности непосредственно связана с практическим использованием информации, с соответствием ее целевой функции деятельности системы.

1.3. меры информации

как и чем можно объективно измерить количество информации и возможно ли это? рассмотрим меры информации и начнем с классификации мер. для измерения информации вводятся два параметра: количество информации – i и объем данных -vд
меры информации
синтаксическая мера
семантическая мера
прагматическая мера
объем данных vд.
количество информации
ic = cvд
где с – коэффициент содержательности
количество информации
ib(a) = h(b) – ib(a)
где h(a)– энтропия

эти параметры имеют разные выражения и интерпретацию в зависимости от рассматриваемой формы адекватности. каждой форме адекватности соответствует своя мера количества информации и объема данных (рис. 2.1).
синтаксическая мера информации. эта мера количества информации оперирует с обезличенной информацией, не выражающей смыслового отношения к объекту.
объем данных vд в сообщении измеряется количеством символов (разрядов) в этом сообщении. в различных системах счисления один разряд имеет различный вес и соответственно меняется единица измерения данных:
• в двоичной системе счисления единица измерения – бит (bit – binary digit – двоичный разряд). в современных эвм наряду с минимальной единицей измерения данных "бит" широко используется укрупненная единица измерения "байт", равная 8 бит.
• в десятичной системе счисления единица измерения – дат (десятичный разряд).
пример сообщение в двоичной системе в виде восьмиразрядного двоичного кода 10111011 имеет объем данных vд = 8 бит или сообщение в десятичной системе в виде шестиразрядного числа 275903 имеет объем данных vд = 6 дит.
количество информации i на синтаксическом уровне невозможно определить без рассмотрения понятия неопределенности состояния системы (энтропии системы). действительно, получение информации о какой-либо системе всегда связано с изменением степени неосведомленности получателя о состоянии этой системы. рассмотрим это понятие. пусть до получения информации потребитель имеет некоторые предварительные (априорные) сведения о системе a. мерой его неосведомленности о системе является функция h(a), которая в то же время служит и мерой неопределенности состояния системы.
после получения некоторого сообщения b получатель приобрел некоторую дополнительную информацию ib(a), уменьшившую его априорную неосведомленность так, что апостериорная (после получения сообщения b) неопределенность состояния системы стала hb(a).
тогда количество информации ib(a) о системе, полученной в сообщении b, определится как
ib(a) = h(a) – hb(a),
т.е. количество информации измеряется изменением (уменьшением) неопределенности состояния системы.
если конечная неопределенность hb(a) обратится в нуль, то первоначальное неполное знание заменится полным знанием и количество информации ib(a) = h(a). иными словами, энтропия (неопределенность состояния) системы h(a) может рассматриваться как мера недостающей информации.
энтропия системы h(a), имеющая n возможных состояний, согласно формуле шеннона, равна:
h(a)=-
где pi вероятность того, что система находится в i-м состоянии.
для случая, когда все состояния системы равновероятны, т.е. их вероятности равны pi = , ее энтропия определяется соотношением
h(a)=-
часто информация кодируется числовыми кодами в той или иной системе счисления, особенно это актуально при представлении информации в компьютере. естественно, что одно и то же количество разрядов в разных системах счисления может передать разное число состояний отображаемого объекта, что можно представить в виде соотношения
n = mn
где n– число всевозможных отображаемых состояний;
m – основание системы счисления (разнообразие символов, применяемых в алфавите);
n – число разрядов (символов) в сообщении.
наиболее часто используются двоичные и десятичные логарифмы. единицами измерения в этих случаях будут соответственно бит и дит.
коэффициент (степень) информативности (лаконичность) сообщения определяется отношением количества информации к объему данных, т.е.
причем 0<</span>y<1
с увеличением y уменьшаются объемы работы по преобразованию информации (данных) в системе. поэтому стремятся к повышению информативности, для чего разрабатываются специальные методы оптимального кодирования информации.
семантическая мера информации. для измерения смыслового содержания информации, т.е. ее количества на семантическом уровне, наибольшее признание получила тезаурусная мера, которая связывает семантические свойства информации со способностью пользователя принимать поступившее сообщение. для этого используется понятие тезаурус пользователя, что означает совокупность сведений, которыми располагает пользователь или система.
в зависимости от соотношений между смысловым содержанием информации s и тезаурусом пользователя sp изменяется количество семантической информации ic, воспринимаемой пользователем и включаемой им в дальнейшем в свой тезаурус. характер такой зависимости показан на рис. 2.2. рассмотрим два предельных случая, когда количество семантической информации /с равно 0:
• при sp 0 пользователь не воспринимает, не понимает поступающую информацию;
• при sp пользователь все знает, и поступающая информация ему не нужна.
рис. 2.2. зависимость количества семантической информации, воспринимаемой потребителем, от его тезауруса ic =¦(sp)
максимальное количество семантической информации ic потребитель приобретает при согласовании ее смыслового содержания s со своим тезаурусом sp(sp = sp opt), когда поступающая информация понятна пользователю и несет ему ранее не известные (отсутствующие в его тезаурусе) сведения.
следовательно, количество семантической информации в сообщении, количество новых знаний, получаемых пользователем, является величиной относительной. одно и тоже сообщение может иметь смысловое содержание для компетентного пользователя и быть бессмысленным (семантический шум) для пользователя некомпетентного.
при оценке семантического (содержательного) аспекта информации необходимо стремиться к согласованию величин s и sp.
относительной мерой количества семантической информации может служить коэффициент содержательности c, который определяется как отношение количества семантической информации к ее объему: c=
прагматическая мера информации. эта мера определяет полезность информации (ценность) для достижения пользователем поставленной цели. эта мера также величина относительная, обусловленная особенностями использования этой информации в той или иной системе. ценность информации целесообразно измерять в тех же самых единицах (или близких к ним), в которых измеряется целевая функция.
пример. в экономической системе прагматические свойства (ценность) информации можно определить приростом экономического эффекта функционирования, достигнутым благодаря использованию этой информации для управления системой:
in b (g) = п(g/b)-п(g),
in b (g) – ценность информационного сообщения b для системы управления g
п(g)– априорный ожидаемый экономический эффект функционирования системы управления g,
п(g/b)-ожидаемый эффект функционирования системы g при условии, что для управления будет использована информация, содержащаяся в сообщении b .
для сопоставления введенные меры информации представим в виде таблицы.
таблица 2.1. единицы измерения информации и примеры
мера информации
единицы измерения
примеры (для компьютерной области)
синтаксическая:
шенноновский подход
степень уменьшения неопределенности
вероятность события
компьютерный подход
единицы представления информации
бит, байт, кбайт и.т.д.
семантическая
тезаурус
пакет прикладных программ, персональный компьютер, компьютерные сети и т.д.

экономические показатели

рентабельность, производительность, коэффициент амортизации и т.д.
прагматическая
ценность использования
емкость памяти, производительность компьютера, скорость передачи данных и т.д.
денежное выражение время обработки информации и принятия решений
1.2. качество информации.
возможность и эффективность использования информации обусловливаются такими основными ее потребительскими показателями качества, как репрезентативность, содержательность, достаточность, доступность, актуальность, своевременность, точность, достоверность, устойчивость.
репрезентативность информации связана с правильностью ее отбора и формирования в целях адекватного отражения свойств объекта. важнейшее значение здесь имеют:
• правильность концепции, на базе которой сформулировано исходное понятие;
• обоснованность отбора существенных признаков и связей отображаемого явления.
нарушение репрезентативности информации приводит нередко к существенным ее погрешностям.
содержательность информации отражает семантическую емкость, равную отношению количества семантической информации в сообщении к объему обрабатываемых данных, т.е.
с увеличением содержательности информации растет семантическая пропускная способность информационной системы, так как для получения одних и тех же сведений требуется преобразовать меньший объем данных.
наряду с коэффициентом содержательности с, отражающим семантический аспект, можно использовать и коэффициент информативности, характеризующийся отношением количества синтаксической информации (по шеннону) к объему данных достаточность (полнота) информации означает, что она содержит минимальный, но достаточный для принятия правильного решения состав (набор показателей). понятие полноты информации связано с ее смысловым содержанием (семантикой) и прагматикой. как неполная, т.е. недостаточная для принятия правильного решения, так и избыточная информация снижает эффективность принимаемых пользователем решений. чем полнее данные, тем шире диапазон методов, которые можно использовать, тем проще подобрать метод, вносящий минимум погрешностей в ход информационного процесса.
доступность информации восприятию пользователя обеспечивается выполнением соответствующих процедур ее получения и преобразования. например, в информационной системе информация преобразовывается к доступной и удобной для восприятия пользователя форме. это достигается, в частности, и путем согласования ее семантической формы с тезаурусом пользователя, мера возможности получить ту или иную информацию. на степень доступности информации влияют одновременно как доступность данных, так и доступность адекватных методов для их интерпретации. отсутствие доступа к данным или отсутствие адекватных методов обработки данных приводят к одинаковому результату: информация оказывается недоступной. отсутствие адекватных методов для работы с данными во многих случаях приводит к применению неадекватных методов, в результате чего образуется неполная, неадекватная или недостоверная информация.
актуальность информации определяется степенью сохранения ценности информации для управления в момент ее использования и зависит от динамики изменения ее характеристик и от интервала времени, прошедшего с момента возникновения данной информации. т.е. это степень соответствия информации текущему моменту времени. нередко с актуальностью, как и с полнотой, связывают коммерческую ценность информации. поскольку информационные процессы растянуты во времени, то достоверная и адекватная, но устаревшая информация может приводить к ошибочным решениям. необходимость поиска (или разработки) адекватного метода для работы с данными может приводить к такой задержке в получении информации, что она становится неактуальной и ненужной. на этом, в частности, основаны многие современные системы шифрования данных с открытым ключом. лица, не владеющие ключом (методом) для чтения данных, могут заняться поиском ключа, поскольку алгоритм его работы доступен, но продолжительность этого поиска столь велика, что за время работы информация теряет актуальность и, соответственно, связанную с ней практическую ценность.
своевременность информации означает ее поступление не позже заранее назначенного момента времени, согласованного с временем решения поставленной задачи.
точность информации определяется степенью близости получаемой информации к реальному состоянию объекта, процесса, явления и т.п. для информации, отображаемой цифровым кодом, известны четыре классификационных понятия точности:
• формальная точность, измеряемая значением единицы младшего разряда числа;
• реальная точность, определяемая значением единицы последнего разряда числа, верность которого гарантируется;
• максимальная точность, которую можно получить в конкретных условиях функционирования системы;
• необходимая точность, определ

Информация

Комментировать статьи на нашем сайте возможно только в течении 60 дней со дня публикации.

Популярные новости

Статистика сайта



Rambler's Top100



 
Copyright © НеОфициальный сайт факультета ЭиП