Вы на НеОфициальном сайте факультета ЭиП

На нашем портале ежедневно выкладываются материалы способные помочь студентам. Курсовые, шпаргалки, ответы и еще куча всего что может понадобиться в учебе!
Главная Контакты Карта сайта
 
Где мы?

Реклама


ИНФОРМАЦИЯ И ЕЁ СВОЙСТВА

Просмотров: 10943 Автор: Angel
Информация и её свойства
Существование области и предмета информатики немыслима без ее основного ресурса – информации. Понимания информации как один из основных стратегических ресурсов общества, необходимо уметь его оценить как с качественной, так и с количественной стороны. На этом пути существуют большие проблемы из-за нематериальной природы этого ресурса и субъективности восприятия конкретной информации различными людьми.
Цель данной лекции ознакомить с тем, что информацию можно оценить как на качественном, так на количественном уровне, и для этого вводятся специальные меры, что для успешной обработки информацию необходимо систематизировать, проводя ее классификацию и кодирование.
1. Понятие информации 
Термин ИНФОРМАЦИЯ произошел от латинского слова informatio – что означает разъяснение, изложение, и первоначально под ним понимали сведения, передаваемые людьми устным, письменным, или, например, с помощью условных сигналов. С середины ХХ века понятие информации становится общенаучным понятие, включающим обмен сведениями между людьми, человеком и автоматом, автоматом и автоматом, обмен сигналами в животном и растительном мире, передачу признаков от клетки к клетке, от организма к организму, а также одним из основных понятий кибернетики.
Однако понятие информация – это настолько общее и глубокое понятие, что его нельзя объяснить одной фразой. В это слово вкладывается различный смысл в технике, науке и в житейских ситуациях. 
В обычном понимании под информацией понимают любые данные или сведения, которые кого-либо интересуют. Например, сообщение о каких-либо событиях, о чьей-либо деятельности и в этом смысле означает "сообщить нечто, неизвестное раньше". 
Информация в процессе практической деятельности человека это сведения об объектах и явлениях окружающей среды, их параметрах, свойствах и состоянии. Например, цвет, запах, шум и т.п. 
В природе информацией является генетический код заложенный в каждом живом организме.
Как мы видим из примеров объединить все эти понятия в единое целое практически невозможно. Однако можно определить общие критерии, что по-нимается под информацией: 
• во-первых, сообщение, ознакомление, осведомление о положении дел, либо сведений о чем-либо, передаваемых людьми; 
• во-вторых, сообщение, уменьшающее или снимающее неопределенность в ре-зультате его получения; 
• в-третьих, сообщение, неразрывно связанное с практической деятельностью человека; 
• в-четвертых, передачу, отражение, разнообразие в любых объектах и процес-сах (неживой и живой природы).
Поэтому, в широком смысле «информация» – это отражение реального мира; в узком смысле «информация» – это любые сведения, являющиеся объектом хранения, передачи и преобразования.
Довольно таки распространенным является и взгляд на информацию как на ресурс, аналогичный материальным, трудовым и денежным ресурсам. С этой точки зрения «информация» – новые сведения, позволяющие улучшить процессы, связанные с преобразованием веществ, энергии и самой информации. И характерное отличие от всех остальных ресурсов – чем больше используют информации тем больше становится ее.
Перейдем теперь к характеристикам информации. Можно выделить три фазы (формы) существования информации:
 ассимилированная информация – представления сообщений в сознании человека, наложенное на систему его понятий и оценок;
 документированная (статическая) информация – сведения зафиксированные в знаковой форме на каком-то физическом носителе (книги, рисунки, записи и т.д.);
 передаваемая информация (динамическая) – сведения, рассматриваемые в момент передачи информации по средствам связи или в пространстве от ис-точника к приемнику.
Информацию можно разделим на два вида: биологическую и социальную. Биологическая информация обеспечивает жизнедеятельность отдельно взятого живого организма. К разновидностям биологической информации относится генетическая информация. Генетическая информация – это получаемая от предков и заложенные в наследственных структурах организмов в виде совокупности генов программы составе, строении и характере обмена составляющих организм веществ.
Социальная информация неразрывно связана с практической деятельностью человека, поэтому можно выделить столько типов и разновидностей, сколько имеется видов деятельности человека. Например, юридическая, научная, техниче-ская, экономическая, финансовая и т.д.
Свойства и функции информации. 
Выделим следующие основные качества информации: 
 достоверность; 
 полнота;
 ценность;
 своевременность;
 понятность;
 доступность;
 краткость. 
Результат анализа различных информационных материалов дает право остановиться на следующих основных функциях, которыми обладает информация: 
 отражательная функция, состоящая в том, что информация содержит сведения, характеризующие свойства какого-либо объекта; 
 гносеологическая функция, осуществляющая с помощью информации про-цесс познания в науках; 
 эвристическая функция, позволяющая с помощью информации осуществ-лять поиск нового, делать открытия; 
 учебно-познавательная функция, дающая возможность использовать в учебном процессе накопленную информацию, воплощенную в учебниках и в другой литературе, а для учащегося это будет приобщение к знаниям, их усвоения, то есть познавательный процесс; 
 организационная функция состоит в том, что информация направляет дея-тельность человека, коллектива в определенное русло, обеспечивает единство действий, то есть, как бы организует людей в их работе. 
Перечислим что можно делать с информацией, ее можно: создавать, переда-вать, воспринимать, использовать, запоминать, принимать, копировать, формализовать, распространять, преобразовывать, комбинировать, обрабатывать, делить на части, упрощать, собирать, хранить, искать, измерять, разрушать и др.
1.2. Информация и ее свойства в информатике.
Информатика рассматривает информацию, как концептуально связанные между собой сведения, данные, понятия, изменяющие наши представления о явлении или объекте окружающего мира. Наряду с информацией в информатике часто употребляется понятие данные. 
Данные – диалектическая составная часть информации. Они представляют собой зарегистрированные сигналы. При этом физический метод регистрации мо-жет быть любым: механическое перемещение физических тел, изменение их формы или параметров качества поверхности, изменение электрических, магнитных, оптических характеристик, химического состава и (или) характера химических связей, изменение состояния электронной системы и многое другое. В соответствии с методом регистрации данные могут храниться и транспортироваться на носителях различных видов. Самым распространенным носителем данных, хотя и не самым экономичным является бумага. На бумаге данные регистрируются путем изменения оптических характеристик ее поверхности. Изменение оптических свойств (изменение коэффициента отражения поверхности в определенном диапазоне длин волн) используется также в устройствах, осуществляющих запись лазерным лучом на пластмассовых носителях с отражающим покрытием (СD-RОМ). В качестве носителей, использующих изменение магнитных свойств, можно назвать магнитные ленты и диски. Регистрация данных путем изменения химического состава поверхностных веществ носителя широко используется в фотографии. На биохимическом уровне происходит накопление и передача данных в живой природе.
Носители данных интересуют нас не сами по себе, а постольку, поскольку свойства информации весьма тесно связаны со свойствами ее носителей. Любой носитель можно характеризовать параметром разрешающей способности (количеством данных, записанных в принятой для носителя единице измерения) и динамическим диапазоном (логарифмическим отношением интенсивности амплитуд максимального и минимального регистрируемого сигналов). От этих свойств носителя нередко зависят такие свойства информации, как полнота, доступность и достоверность.
Понятия информация и данные тесно связаны между собой и с методом обработки. Примером может служить прослушивание передачи на незнакомом языке. Мы регистрируем, записываем, данные, но не знаем, что принимаем, но взяв словарик переводим, применяем метод обработки данных, и получаем информацию. Данные несут в себе информацию о событиях. Однако эти два понятия не тождественны. Сформулируем: Информация – это продукт взаимодействия данных и адекватных им методов.
Рассмотрим взаимосвязь между данными и информацией на приведенном примере.




С точки зрения информатики наиболее важными представляются следующие свойства информации.
Объективность и субъективность информации. Понятие объективности информации является относительным. Это понятно, если учесть, что методы являются субъективными. Более объективной принято считать ту информацию, в которую методы вносят меньший субъективный элемент. Так, например, принято считать, что в результате наблюдения фотоснимка природного объекта или явления образуется более объективная информация, чем в результате наблюдения рисунка того же объекта, выполненного человеком. В ходе информационного процесса степень объективности информации всегда понижается. Это свойство учитывают, например, в правовых дисциплинах, где по-разному обрабатываются показания лиц, непосредственно наблюдавших события или получивших информацию косвенным путем (посредством умозаключений или со слов третьих лиц). В не меньшей степени объективность информации учитывают в исторических дисциплинах. Одни и те же события, зафиксированные в исторических документах разных стран и народов, выглядят совершенно по-разному. У историков имеются свои методы для тестирования объективности исторических данных и создания новых, более достоверных данных путем сопоставления, фильтрации и селекции исходных данных. Об-ратим внимание на то, что здесь речь идет не о повышении объективности данных, а о повышении их достоверности (это совсем другое свойство).
Адекватность информации наиболее важная характеристика информации для потребителя, это определенный уровень соответствия создаваемого с помощью полученной информации образа реальному объекту, процессу, явлению. (Степень соответствия реальному объективному состоянию дела.)
В реальной жизни вряд ли возможна ситуация, когда вы сможете рассчитывать на полную адекватность информации. Всегда присутствует некоторая степень неопределенности т.е. неполной или недостоверной информации. От степени адекватности информации реальному состоянию объекта или процесса зависит правильность принятия решений человеком.
Например. Вы успешно закончили школу и хотите продолжить образование по экономическому направлению. Поговорив с друзьями, вы узнаете, что подобную подготовку можно получить в разных вузах. В результате таких бесед вы получаете весьма разноречивые сведения, которые не позволяют вам принять решение в пользу того или иного варианта, т.е. полученная информация неадекватна реальному состоянию дел. Для того чтобы получить более достоверные сведения, вы покупаете справочник для поступающих в вузы, из которого получаете исчерпывающую информацию. В этом случае можно говорить, что информация, полученная вами из справочника, адекватно отражает, направления обучения в вузах и помогает вам определиться в окончательном выборе.
Формы адекватности информации. Адекватность информации может выражаться в трех формах: семантической, синтаксической, прагматической.
Синтаксическая адекватность. Она отображает формально-структурные характеристики информации и не затрагивает ее смыслового содержания. На синтаксическом уровне учитываются тип носителя и способ представления информации, скорость передачи и обработки, размеры кодов представления информации, надежность и точность преобразования этих кодов и т.п. Информацию, рассматриваемую только с синтаксических позиций, обычно называют данными, так как при этом не имеет значения смысловая сторона. Эта форма способствует восприятию внешних структурных характеристик, т.е. синтаксической стороны информации.
Семантическая (смысловая) адекватность. Эта форма определяет степень соответствия образа объекта и самого объекта. Семантический аспект пред-полагает учет смыслового содержания информации. На этом уровне анализируются те сведения, которые отражает информация, рассматриваются смысловые связи. В информатике устанавливаются смысловые связи между кодами представления информации. Эта форма служит для формирования понятий и представлений, выявления смысла, содержания информации и ее обобщения.
Прагматическая (потребительская) адекватность. Она отражает отношение информации и ее потребителя, соответствие информации цели управления, которая на ее основе реализуется. Проявляются прагматические свойства информации только при наличии единства информации (объекта), пользователя и цели управления. Прагматический аспект рассмотрения связан с ценностью, полезностью использования информации при выработке потребителем решения для достижения своей цели. С этой точки зрения анализируются потребительские свойства информации. Эта форма адекватности непосредственно связана с практическим использованием информации, с со-ответствием ее целевой функции деятельности системы.
1.3. Меры информации
Как и чем можно объективно измерить количество информации и возможно ли это? Рассмотрим меры информации и начнем с классификации мер. Для измерения информации вводятся два параметра: количество информации – I и объем данных -Vд
Эти параметры имеют разные выражения и интерпретацию в зависимости от рассматриваемой формы адекватности. Каждой форме адекватности со-ответствует своя мера количества информации и объема данных (рис. 2.1).
Синтаксическая мера информации. Эта мера количества информации опе-рирует с обезличенной информацией, не выражающей смыслового отношения к объекту.
Объем данных Vд в сообщении измеряется количеством символов (разрядов) в этом сообщении. В различных системах счисления один разряд имеет различный вес и соответственно меняется единица измерения данных:
• в двоичной системе счисления единица измерения – бит (bit – binary digit – двоичный разряд). В современных ЭВМ наряду с минимальной единицей из-мерения данных "бит" широко используется укрупненная единица измерения "байт", равная 8 бит.
• в десятичной системе счисления единица измерения – дат (десятичный раз-ряд).
Пример Сообщение в двоичной системе в виде восьмиразрядного двоичного кода 10111011 имеет объем данных Vд = 8 бит или сообщение в десятичной системе в виде шестиразрядного числа 275903 имеет объем данных Vд = 6 дит.
Количество информации I на синтаксическом уровне невозможно определить без рассмотрения понятия неопределенности состояния системы (энтропии системы). Действительно, получение информации о какой-либо системе всегда связано с изменением степени неосведомленности получателя о состоянии этой системы. Рассмотрим это понятие. Пусть до получения информации потребитель имеет некоторые предварительные (априорные) сведения о системе . Мерой его неосведомленности о системе является функция H(), которая в то же время служит и мерой неопределенности состояния системы.
После получения некоторого сообщения  получатель приобрел некоторую дополнительную информацию I(), уменьшившую его априорную неосведомленность так, что апостериорная (после получения сообщения ) неопределенность состояния системы стала H().
Тогда количество информации I() о системе, полученной в сообщении , определится как
I() = H() – H(),
т.е. количество информации измеряется изменением (уменьшением) неопределенности состояния системы.
Если конечная неопределенность H() обратится в нуль, то первоначальное неполное знание заменится полным знанием и количество информации I() = H(). Иными словами, энтропия (неопределенность состояния) системы H() может рассматриваться как мера недостающей информации.
Энтропия системы H(), имеющая N возможных состояний, согласно формуле Шеннона, равна:
H()=- 
где Pi вероятность того, что система находится в i-м состоянии.
Для случая, когда все состояния системы равновероятны, т.е. их вероятности равны Pi = , ее энтропия определяется соотношением
H()=- 
Часто информация кодируется числовыми кодами в той или иной системе счисления, особенно это актуально при представлении информации в компьюте-ре. Естественно, что одно и то же количество разрядов в разных системах счисления может передать разное число состояний отображаемого объекта, что можно представить в виде соотношения
N = mn
где N– число всевозможных отображаемых состояний;
m – основание системы счисления (разнообразие символов, применяемых в алфавите); 
n – число разрядов (символов) в сообщении.
Наиболее часто используются двоичные и десятичные логарифмы. Единицами измерения в этих случаях будут соответственно бит и дит.
Коэффициент (степень) информативности (лаконичность) сообщения определяется отношением количества информации к объему данных, т.е. 
  причем 0С увеличением Y уменьшаются объемы работы по преобразованию информации (данных) в системе. Поэтому стремятся к повышению информативности, для чего разрабатываются специальные методы оптимального кодирования информации.
Семантическая мера информации. Для измерения смыслового содержания информации, т.е. ее количества на семантическом уровне, наибольшее признание получила тезаурусная мера, которая связывает семантические свойства инфор-мации со способностью пользователя принимать поступившее сообщение. Для этого используется понятие тезаурус пользователя, что означает совокупность сведений, которыми располагает пользователь или система.
В зависимости от соотношений между смысловым содержанием информации S и тезаурусом пользователя Sp изменяется количество семантической ин-формации Ic, воспринимаемой пользователем и включаемой им в дальнейшем в свой тезаурус. Характер такой зависимости показан на рис. 2.2. Рассмотрим два предельных случая, когда количество семантической информации /с равно 0:
• при Sp 0 пользователь не воспринимает, не понимает поступающую информацию;
• при Sp пользователь все знает, и поступающая информация ему не нужна.
 
Рис. 2.2. Зависимость количества семантической информации, воспринимаемой потребителем, от его тезауруса Ic =(Sp)
Максимальное количество семантической информации Ic потребитель приоб-ретает при согласовании ее смыслового содержания S со своим тезаурусом Sp(Sp = Sp opt), когда поступающая информация понятна пользователю и несет ему ранее не известные (отсутствующие в его тезаурусе) сведения.
Следовательно, количество семантической информации в сообщении, количество новых знаний, получаемых пользователем, является величиной от-носительной. Одно и тоже сообщение может иметь смысловое содержание для компетентного пользователя и быть бессмысленным (семантический шум) для пользователя некомпетентного.
При оценке семантического (содержательного) аспекта информации необхо-димо стремиться к согласованию величин S и Sp.
Относительной мерой количества семантической информации может служить коэффициент содержательности C, который определяется как отношение количества семантической информации к ее объему: C=  
Прагматическая мера информации. Эта мера определяет полезность информации (ценность) для достижения пользователем поставленной цели. Эта мера также величина относительная, обусловленная особенностями использования этой информации в той или иной системе. Ценность информации целесообразно измерять в тех же самых единицах (или близких к ним), в которых измеряется целевая функция.
Пример. В экономической системе прагматические свойства (ценность) информации можно определить приростом экономического эффекта функционирования, достигнутым благодаря использованию этой информации для управления системой:
In () = П(/)-П(),
In () – ценность информационного сообщения для системы управления 
П()– априорный ожидаемый экономический эффект функционирования сис-темы управления , 
П(/)-ожидаемый эффект функционирования системы  при условии, что для управления будет использована информация, содержащаяся в сообщении .
Для сопоставления введенные меры информации представим в виде таблицы. 
Таблица 2.1. Единицы измерения информации и примеры
Мера информации Единицы измерения Примеры (для компьютерной области)
Синтаксическая:  
шенноновский подход Степень уменьшения неопределенности Вероятность события
компьютерный подход Единицы представления информации Бит, байт, Кбайт и.т.д.
Семантическая Тезаурус Пакет прикладных программ, персо-нальный компьютер, компьютерные сети и т.д.
 Экономические показа-тели Рентабельность, производительность, коэффициент амортизации и т.д.
Прагматическая Ценность использо-вания Емкость памяти, производительность компьютера, скорость передачи дан-ных и т.д. 
Денежное выражение Время обработки информации и принятия решений
1.2. Качество информации. 
Возможность и эффективность использования информации обусловливаются такими основными ее потребительскими показателями качества, как репрезента-тивность, содержательность, достаточность, доступность, актуальность, свое-временность, точность, достоверность, устойчивость.
Репрезентативность информации связана с правильностью ее отбора и формирования в целях адекватного отражения свойств объекта. Важнейшее значение здесь имеют:
• правильность концепции, на базе которой сформулировано исходное понятие;
• обоснованность отбора существенных признаков и связей отображаемого явления.
Нарушение репрезентативности информации приводит нередко к существен-ным ее погрешностям.
Содержательность информации отражает семантическую емкость, равную отношению количества семантической информации в сообщении к объему обрабатываемых данных, т.е.
 
С увеличением содержательности информации растет семантическая пропускная способность информационной системы, так как для получения одних и тех же сведений требуется преобразовать меньший объем данных.
Наряду с коэффициентом содержательности С, отражающим семантический аспект, можно использовать и коэффициент информативности, характеризующийся отношением количества синтаксической информации (по Шеннону) к объему данных 
Y .
Достаточность (полнота) информации означает, что она содержит мини-мальный, но достаточный для принятия правильного решения состав (набор показателей). Понятие полноты информации связано с ее смысловым содержанием (семантикой) и прагматикой. Как неполная, т.е. недостаточная для принятия правильного решения, так и избыточная информация снижает эффективность принимаемых пользователем решений. Чем полнее данные, тем шире диапазон методов, которые можно использовать, тем проще подобрать метод, вносящий минимум погрешностей в ход информационного процесса.
Доступность информации восприятию пользователя обеспечивается выпол-нением соответствующих процедур ее получения и преобразования. Например, в информационной системе информация преобразовывается к доступной и удобной для восприятия пользователя форме. Это достигается, в частности, и путем согласования ее семантической формы с тезаурусом пользователя, мера возможности получить ту или иную информацию. На степень доступности информации влияют одновременно как доступность данных, так и доступность адекватных методов для их интерпретации. Отсутствие доступа к данным или отсутствие адекватных методов обработки данных приводят к одинаковому результату: информация оказывается недоступной. Отсутствие адекватных методов для работы с данными во многих случаях приводит к применению неадекватных методов, в результате чего образуется неполная, неадекватная или недостоверная информация.
Актуальность информации определяется степенью сохранения ценности информации для управления в момент ее использования и зависит от динамики изменения ее характеристик и от интервала времени, прошедшего с момента возникновения данной информации. Т.е. это степень соответствия информации текущему моменту времени. Нередко с актуальностью, как и с полнотой, связывают коммерческую ценность информации. Поскольку информационные процессы растянуты во времени, то достоверная и адекватная, но устаревшая информация может приводить к ошибочным решениям. Необходимость поиска (или разработки) адекватного метода для работы с данными может приводить к такой задержке в получении информации, что она становится неактуальной и ненужной. На этом, в частности, основаны многие современные системы шифрования данных с открытым ключом. Лица, не владеющие ключом (методом) для чтения данных, могут заняться поиском ключа, поскольку алгоритм его работы доступен, но продолжительность этого поиска столь велика, что за время работы информация теряет актуальность и, соответственно, связанную с ней практическую ценность.
Своевременность информации означает ее поступление не позже заранее назначенного момента времени, согласованного с временем решения поставленной задачи. 
Точность информации определяется степенью близости получаемой информации к реальному состоянию объекта, процесса, явления и т.п. Для ин-формации, отображаемой цифровым кодом, известны четыре классификационных понятия точности:
• формальная точность, измеряемая значением единицы младшего разряда числа;
• реальная точность, определяемая значением единицы последнего разряда числа, верность которого гарантируется;
• максимальная точность, которую можно получить в конкретных условиях функционирования системы;
• необходимая точность, определяемая функциональным назначением показателя.
Достоверность информации определяется ее свойством отражать реально существующие объекты с необходимой точностью. Измеряется достоверность информации доверительной вероятностью необходимой точности, т.е. вероятностью того, что отображаемое информацией значение параметра отличается от истинного значения этого параметра в пределах необходимой точности. Данные возникают в момент регистрации сигналов, но не все сигналы являются «полезными» – всегда присутствует какой-то уровень посторонних сигналов, в результате чего полезные данные сопровождаются определенным уровнем «информационного шума». Если полезный сигнал зарегистрирован более четко, чем посторонние сигналы, достоверность информации может быть более высокой. При увеличении уровня шумов достоверность информации снижается. В этом случае для передачи того же количества информации требуется использовать либо больше данных, либо более сложные методы.
Устойчивость информации отражает ее способность реагировать на изменения исходных данных без нарушения необходимой точности. Устойчивость информации, как и репрезентативность, обусловлена выбранной методикой ее отбора и формирования.
В заключение следует отметить, что такие параметры качества информации, как репрезентативность, содержательность, достаточность, доступность, устойчи-вость, целиком определяются на методическом уровне разработки информацион-ных систем. Параметры актуальности, своевременности, точности и достоверности обусловливаются в большей степени также на методическом уровне, однако на их величину существенно влияет и характер функционирования системы, в первую очередь ее надежность. При этом параметры актуальности и точности жестко связаны соответственно с параметрами своевременности и достоверности.
1.3. КЛАССИФИКАЦИЯ И КОДИРОВАНИЕ ИНФОРМАЦИИ
1.3.1. Система классификации.
Общие сведения
Важным понятием при работе с информацией является классификация объ-ектов.
Классификация – система распределения объектов (предметов, явлений, про-цессов, понятий) по классам в соответствии с определенным признаком.
Под объектом понимается любой предмет, процесс, явление материального или нематериального свойства. Система классификации позволяет сгруппировать объекты и выделить определенные классы, которые будут характеризоваться ря-дом общих свойств. Классификация объектов – это процедура группировки на качественном уровне, направленная на выделение однородных свойств. Применительно к информации как к объекту классификации выделенные классы называют информационными объектами.
Пример Всю информацию об университете можно классифицировать по многочисленным информационным объектам, которые будут характеризоваться общими свойствами:
• информация о студентах – в виде информационного объекта "Студент";
• информация о преподавателях – в виде информационного объекта "Преподаватель";
• информация о факультетах – в виде информационного объекта "Факультет" и т.п. 
Свойства информационного объекта определяются информационными пара-метрами, называемыми реквизитами. Реквизиты представляются либо числовыми данными, например вес, стоимость, год, либо признаками, например цвет, марка машины, фамилия.
Реквизит – логически неделимый информационный элемент, описывающий определенное свойство объекта, процесса, явления и т.п.
Пример Информация о каждом студенте в отделе кадров университета систе-матизирована и представлена посредством одинаковых реквизитов:
– фамилия, имя, отчество;
– пол;
– год рождения;
– место рождения;
– адрес проживания;
– факультет, где проходит обучение студент, и т.д. 
Все перечисленные реквизиты характеризуют свойства информационного объекта "Студент".
Кроме выявления общих свойств информационного объекта, классификация нужна для разработки правил (алгоритмов) и процедур обработки информации, представленной совокупностью реквизитов.
Пример Алгоритм обработки информационных объектов библиотечного фонда позволяет получить информацию обо всех книгах по определенной тематике, об авторах, абонентах и т.д.
Алгоритм обработки информационных объектов фирмы позволяет получить информацию об объемах продаж, о прибыли, заказчиках, видах производимой продукции и т.д.
Алгоритмы обработки в том и другом случае преследуют разные цели, обрабатывают разную информацию, реализуются разными способами.
При любой классификации желательно, чтобы соблюдались следующие требования:
• полнота охвата объектов рассматриваемой области;
• однозначность реквизитов;
• возможность включения новых объектов.
В любой стране разработаны и применяются государственные, отраслевые, региональные классификаторы. Например, классифицированы отрасли промышленности, оборудование, профессии, единицы измерения, статьи затрат и т.д.
Классификатор – систематизированный свод наименований и кодов класси-фикационных группировок.
При классификации широко используются понятия классификационный признак и значение классификационного признака, которые позволяют установить сходство или различие объектов. Возможен подход к классификации с объединением этих двух понятий в одно, названное как признак классификации. Признак классификации имеет также синоним основание деления.
Пример В качестве признака классификации выбирается возраст, который состоит из трех значений: до 20 лет, от 20 до 30 лет, свыше 30 лет.
Можно в качестве признаков классификации использовать: возраст до 20 лет, возраст от 20 до 30 лет, возраст свыше 30 лет.
Разработаны три метода классификации объектов: иерархический, фасетный, дескрипторный. Эти методы различаются разной стратегией применения классификационных признаков. Так же можно встретить понятие структура данных: иерархическая, табличная, линейная.
Рассмотрим основные идеи этих методов для создания систем классификации.
1.3.2. Иерархическая система классификации
Иерархическая система классификации строится следующим образом:
• исходное множество элементов составляет 0-й уровень и делится в зависимости от выбранного классификационного признака на классы (группировки), которые образуют 1-й уровень;
• каждый класс 1-го уровня в соответствии со своим, характерным для него классификационным признаком делится на подклассы, которые образуют 2-й уровень;
• каждый класс 2-го уровня аналогично делится на группы, которые образуют 3-й уровень, и т.д.
Учитывая достаточно жесткую процедуру построения структуры классификации, необходимо перед началом работы определить ее цель, т.е. каки-ми свойствами должны обладать объединяемые в классы объекты. Эти свойства принимаются в дальнейшем за признаки классификации.
В иерархической системе классификации каждый объект на любом уровне должен быть отнесен к одному классу, который характеризуется конкретным значением выбранного классификационного признака. Для последующей группировки в каждом новом классе необходимо задать свои классификационные признаки и их значения. Таким образом, выбор классификационных признаков будет зависеть от семантического содержания того класса, для которого необходима группировка на последующем уровне иерархии. Количество уровней классификации, соответствующее числу признаков, выбранных в качестве основания деления, характеризует глубину классификации.
К достоинства иерархической системы классификации относится:
• простота построения;
• использование независимых классификационных признаков в различных ветвях иерархической структуры.
К недостаткам:
• жесткая структура, которая приводит к сложности внесения изменений, так как приходится перераспределять все классификационные группировки;
• невозможность группировать объекты по заранее не предусмотренным сочетаниям признаков.
Пример. Поставлена задача – создать иерархическую систему классификации для информационного объекта "Факультет", которая позволит классифицировать информацию обо всех студентах по следующим классифика-ционным признакам: факультет, на котором он учится, возрастной состав студентов, пол студента, для женщин – наличие детей.
Система классификации представлена на рис.2.4 и будет иметь следующие уровни: 0-й уровень. Информационный объект "Факультет";
1-й уровень. Выбирается классификационный признак – название факультета, что позволяет выделить несколько классов с разными названиями факультетов, в которых хранится информация обо всех студентах.
2-й уровень. Выбирается классификационный признак – возраст, который имеет три градации: до 20 лет, от 20 до 30 лет, свыше 30 лет. По каждому факультету выделяются три возрастных подкласса студентов.
3-й уровень. Выбирается классификационный признак – пол. Каждый под-класс 2-го уровня разбивается на две группы. Таким образом, информация о студентах каждого факультета в каждом возрастном подклассе разделяется на две группы – мужчин и женщин.
4-й уровень. Выбирается классификационный признак – наличие детей у женщин: есть, нет.
Созданная иерархическая система классификации имеет глубину классификации, равную четырем.
1.3.3. Фасетная система классификации
Фасетная система классификации в отличие от иерархической позволяет выбирать признаки классификации независимо как друг от друга, так и от семантического содержания классифицируемого объекта. Признаки классификации называются фасетами (facet-рамка). Каждый фасет (Фi) содержит совокупность однородных значений данного классификационного признака. Причем значения в фасете могут располагаться в произвольном порядке, хотя предпочтительнее их упорядочение.
Пример. Фасет цвет содержит значения: красный, белый, зеленый, черный, желтый.
Фасет специальность содержит названия специальностей.
Фасет образование содержит значения: среднее, среднее специальное, высшее.
Схема построения фасетной системы классификации в виде таблицы отобра-жена на рис. 2.5. Названия столбцов соответствуют выделенным классификацион-ным признакам (фасетам), обозначенным Ф1, Ф2, ..., Фi, ..., Фn.. Например, цвет, размер одежды, вес и т.д. Произведена нумерация строк таблицы. В каждой клетке таблицы хранится конкретное значение фасета. Например, фасет цвет, обозначенный Ф2, содержит значения: красный, белый, зеленый, черный, желтый. Процедура классификации состоит в присвоении каждому объекту соот-ветствующих значений из фасетов. При этом могут быть использованы не все фасеты. Для каждого объекта задается конкретная группировка фасетов структурной формулой, в которой отражается их порядок следования: Кs=(Ф1, Ф2, ..., Фi, ..., Фn), где Фi -i-ный фасет; n – количество фасетов.

 Фасеты
Знначение фасе-тов Ф1, Ф2, Фi, Фn
 1  
 2  
 3  
 .  
 K  
Рис. 2.5. Фасетной системы классификации.

При построении фасетной системы классификации необходимо, чтобы значе-ния, используемые в различных фасетах, не повторялись. Фасетную систему легко можно модифицировать, внося изменения в конкретные значения любого фасета.
Достоинства фасетной системы классификации: 
• возможность создания большой емкости классификации, т.е. использования большого числа признаков классификации и их значений для создания группировок;
• возможность простой модификации всей системы классификации без изменения
структуры существующих группировок.
Недостатком фасетной системы классификации является сложность ее по-строения, так как необходимо учитывать все многообразие классификационных признаков.
Пример. Обратитесь к содержанию примера, где показано построение иерархической системы классификации. Для сопоставления разработаем фасетную систему классификации.
Сгруппируем и представим в виде таблицы (рис. 2.6) все классификационные признаки по фасетам:
• фасет название факультета с пятью названиями факультетов;
• фасет возраст с тремя возрастными группами;
• фасет пол с двумя градациями;
• фасет дети с двумя градациями.
Структурную формулу любого класса можно представить в виде:
Кs = (Факультет, Возраст, Пол, Дети)
Присваивая конкретные значения каждому фасету, получим следующие классы:
• К1= (Радиотехнический факультет, возраст до 20 лет, мужчина, есть дети);
• К2– (Машиностроительный факультет, возраст от 20 до 30 лет, мужчина, детей нет);
• К3– (Коммерческий факультет, возраст от 20 до 30 лет, мужчина, детей нет).
• 
Название факультета Возраст Пол Дети
Радиотехнический До 20 лет М Есть
Машиностроительный 20 – 30 лет Ж Нет
Коммерческий Свыше 30 лет  
Информационные системы  
Математический  
Рис. 2.6. Пример фасеткой системы классификации для информационного объекта "Факультет"
1.2.4.Дескрипторная система классификации
Для организации поиска информации, для ведения тезаурусов (словарей) эф-фективно используется дескрипторная (описательная) система классификации, язык которой приближается к естественному языку описания информационных объектов. Особенно широко она используется в библиотечной системе поиска.
Суть дескрипторного метода классификации заключается в следующем:
• отбирается совокупность ключевых слов или словосочетаний, описывающих определенную предметную область или совокупность однородных объектов. Причем среди ключевых слов могут находиться синонимы;
• выбранные ключевые слова и словосочетания подвергаются нормализации, т.е. из совокупности синонимов выбирается один или несколько наиболее употре-бимых;
• создается словарь дескрипторов, т.е. словарь ключевых слов и словосочетаний, отобранных в результате процедуры нормализации.
Пример В качестве объекта классификации рассматривается успеваемость студентов. Ключевыми словами могут быть выбраны: оценка, экзамен, зачет, преподаватель, студент, семестр, название предмета. Здесь нет синонимов, и поэтому указанные ключевые слова можно использовать как словарь дескрипторов. В качестве предметной области выбирается учебная деятельность в высшем учебном заведении. Ключевыми словами могут быть выбраны: студент, обучаемый, учащийся, преподаватель, учитель, педагог, лектор, ассистент, доцент, профессор, коллега, факультет, подразделение университета, аудитория, комната, лекция, практическое занятие, занятие и т.д. Среди указанных ключевых слов встречаются синонимы, например: студент, обучае-мый, учащийся; преподаватель, учитель, педагог; факультет, подразделение университета и т.д. После нормализации словарь дескрипторов будет состоять из следующих слов: студент, преподаватель, лектор, ассистент, доцент, профессор, факультет, аудитория, лекция, практическое занятие и т.д.
Между дескрипторами устанавливаются связи, которые позволяют расширить область поиска информации. Связи могут быть трех видов:
• синонимические, указывающие некоторую совокупность ключевых слов как синонимы;
• родо-видовые, отражающие включение некоторого класса объектов в более представительный класс;
• ассоциативные, соединяющие дескрипторы, обладающие общими свойствами.
Пример Синонимическая связь: студент – учащийся – обучаемый. Родо-видовая связь: университет – факультет – кафедра. Ассоциативная связь: студент – экзамен – профессор – аудитория.
2.1 СИСТЕМА КОДИРОВАНИЯ
Общие понятия
Система кодирования применяется для замены названия объекта на условное обозначение (код) в целях обеспечения удобной и более эффективной обработки информации.
Система кодирования – совокупность правил кодового обозначения объектов
Код строится на базе алфавита, состоящего из букв, цифр и других символов. Код характеризуется:
• длиной – число позиций в коде; 
• структурой – порядок расположения в коде символов, используемых для обозначения классификационного признака.
Процедура присвоения объекту кодового обозначения называется кодированием. Можно выделить две группы методов, используемых в системе кодирования (рис.2.7), которые образуют:
• классификационную систему кодирования, ориентированную на проведение предварительной классификации объектов либо на основе иерархической системы, либо на основе фасетной системы;
• регистрационную систему кодирования, не требующую предварительной классификации объектов. 
Рассмотрим представленную на рис. 2.7 систему кодирования.
Классификационное кодирование
Классификационное кодирование применяется после проведения классификации объектов. Различают последовательное и параллельное кодирование.
Последовательное кодирование используется для иерархической классификационной структуры. Суть метода заключается в следующем: сначала записывается код старшей группировки 1-го уровня, затем код группировки 2-го уровня, затем код группировки 3-го уровня и т.д. В результате получается кодовая комбинация, каждый разряд которой содержит информацию о специфике выделенной группы на каждом уровне иерархической структуры. Последовательная система кодирования обладает теми же достоинствами и недостатками, что и иерархическая система классификации.
Пример Проведем кодирование информации, классифицированной с помощью иерархической схемы (см. рис. 2.4). Количество кодовых группировок будет определяться глубиной классификации и равно 4. Прежде чем начать кодирование, необходимо определиться с алфавитом, т.е. какие будут использоваться символы. Для большей наглядности выберем десятичную систему счисления – 10 арабских цифр. Анализ схемы на рис. 2.4 показывает, что длина кода определяется 4 десятичными разрядами, а кодирование группировки на каждом уровне можно делать путем последовательной нумерации слева направо. В общем виде код можно записать как ХХХХ, где X – значение десятичного разряда. Рассмотрим структуру кода, начиная со старшего разряда:
1-й (старший) разряд выделен для классификационного признака "название факультета" и имеет следующие значения: 1 – коммерческий; 2 – информационные системы; 3 – для следующего названия факультета и т.д.;
2-й разряд выделен для классификационного признака "возраст" и имеет следующие значения: 1 – до 20 лет; 2 – от 20 до 30 лет; 3 – свыше 30 лет;
3-й разряд выделен для классификационного признака "пол" и имеет следующие значения: 1.– мужчины; 2 – женщины;
4-й разряд выделен для классификационного признака "наличие детей у женщин" и имеет следующие значения: 1 – есть дети; 2 – нет детей, 0 – для мужчин, так как подобной информации не требуется.
Принятая система кодирования позволяет легко расшифровать любой код группировки, например:
1310 – студенты коммерческого факультета, свыше 30 лет, мужчины; 2221 – студенты факультета информационных систем, от 20 до 30 лет, женщины, имеющие детей.
Параллельное кодирование используется для фасетной системы классификации. Суть метода заключается в следующем: все фасеты кодируются независимо друг от друга; для значений каждого фасета выделяется определенное количество разрядов кода. Параллельная система кодирования обладает теми же достоинствами и недостатками, что и фасетная система классификации.
Пример Проведем кодирование информации, классифицированной с помощью фасетной схемы (см. рис. 2.6). Количество кодовых группировок определяется количеством фасетов и равно 4. Выберем десятичную систему счисления в качестве алфавита кодировки, что позволит для значений фасетов выделить один разряд и иметь длину кода, равную 4. В отличие от последовательного кодирования для иерархической системы классификации в данном методе не имеет значения порядок кодировки фасетов. В общем виде код можно записать как ХХХХ, где X – значение десятичного разряда. Рассмотрим структуру кода, начиная со старшего разряда:
1-й (старший) разряд выделен для фасета "пол" и имеет следующие значе-ния: 1 – мужчины; 2 – женщины;
2-й разряд выделен для фасета "наличие детей у женщин" и имеет следующие значения: 1 – есть дети; 2 – нет детей, 0 – для мужчин, так как подобной информации не требуется;
3-й разряд выделен для фасета "возраст" и имеет следующие значения: 1 – до 20 лет; 2 – от 20 до 30 лет; 3 – свыше 30 лет;
4-й разряд выделен для фасета "название факультета" и имеет следующие значения: 1 – радиотехнический, 2 – машиностроительный, 3 – коммерческий; 4 – информационные системы; 5 – математический и т.д.
Принятая система кодирования позволяет легко расшифровать любой код группировки, например:
2135 – женщины в возрасте свыше 30 лет, имеющие детей и являющиеся сту-дентами математического факультета;
1021 – мужчины возраста от 20 до 30 лет, являющиеся студентами радиотехнического факультета.
Регистрационное кодирование
Регистрационное кодирование используется для однозначной идентификации объектов и не требует предварительной классификации объектов. Различают порядковую и серийно-порядковую систему. 
Порядковая система кодирования предполагает последовательную нумера-цию объектов числами натурального ряда. Этот порядок может быть случайным или определяться после предварительного упорядочения объектов, например по алфавиту. Этот метод применяется в том случае, когда количество объектов невелико, например кодирование названий факультетов университета, кодирование студентов в учебной группе.
Серийно-порядковая система кодирования предусматривает предварительное выделение групп объектов, которые составляют серию, а затем в каждой серии производится порядковая нумерация объектов. Каждая серия также будет иметь порядковую нумерацию. По своей сути серийно-порядковая система является смешанной: классифицирующей и идентифицирующей. Применяется тогда, когда количество групп невелико.
Пример Все студенты одного факультета разбиваются на учебные группы (в данной терминологии – серии), для которых используется порядковая нумерация. Внутри каждой группы производится упорядочение фамилий студентов по алфавиту и каждому студенту присваивается номер.
КЛАССИФИКАЦИЯ ИНФОРМАЦИИ ПО РАЗНЫМ ПРИЗНАКАМ
Любая классификация всегда относительна. Один и тот же объект может быть классифицирован по разным признакам или критериям. Часто встречаются ситуации, когда в зависимости от условий внешней среды объект может быть отнесен к разным классификационным группировкам. Эти рассуждения особенно актуальны при классификации видов информации без учета ее предметной ориентации, так как она часто может быть использована в разных условиях, разными потребителями, для разных целей.
На рис. 2.8 приведена одна из схем классификации циркулирующей в организации (фирме) информации. В основу классификации положено пять наиболее общих признаков: место возникновения, стадия обработки, способ отображения, стабильность, функция управления.
Место возникновения. По этому признаку информацию можно разделить на входную выходную, внутреннюю, внешнюю.
Входная информация – это информация, поступающая в фирму или ее подразделения.
Выходная информация – это информация, поступающая из фирмы в другую фирму, организацию (подразделение).
Одна и та же информация может являться входной для одной фирмы, а для другой, ее вырабатывающей, выходной. По отношению к объекту управления (фирма или ее подразделение: цех, отдел, лаборатория) информация может быть определена как внутренняя, так и внешняя.
Внутренняя информация возникает внутри объекта, внешняя информация – за пределами объекта.
Пример Содержание указа правительства об изменении уровня взимаемых налогов для фирмы является, с одной стороны, внешней информацией, с другой стороны – входной. Сведения фирмы в налоговую инспекцию о размере отчислении в госбюджет являются, с одной стороны, выходной информацией, с другой стороны – внешней по отношению к налоговой инспекции.
Стадия обработки. По стадии обработки информация может быть первичной, вторичной, промежуточной, результатной.
Первичная информация – это информация, которая возникает непосредственно в процессе деятельности объекта и регистрируется на начальной стадии.
Вторичная информация – это информация, которая получается в результате обработки первичной информации и может быть промежуточной и результатной.
Промежуточная информация используется в качестве исходных данных для последующих расчетов.
Результатная информация получается в процессе обработки первичной и промежуточной информации и используется для выработки управленческих решений.
Пример В художественном цехе, где производится роспись чашек, в конце каждой смены регистрируется общее количество произведенной продукции и количество расписанных чашек каждым работником. Это первичная информация. В конце каждого месяца мастер подводит итоги первичной информации. Это будет, с одной стороны, вторичная промежуточная информация, а с другой стороны – результатная. Итоговые данные поступают в бухгалтерию, где производится расчет заработной платы каждого работника в зависимости от его выработки. Полученные расчетные данные – результатная информация.
Способ отображения. По способу отображения информация подразделяется на текстовую и графическую.
Текстовая информация – это совокупность алфавитных, цифровых и специ-альных символов, с помощью которых представляется информация на физическом носителе (бумага, изображение на экране дисплея).
Графическая информация – это различного рода графики, диаграммы, схемы, рисунки и т.д.
Стабильность. По стабильности информация может быть переменной (теку-щей) и постоянной (условно-постоянной).
Переменная информация отражает фактические количественные и качествен-ные характеристики производственно-хозяйственной деятельности фирмы. Она может меняться для каждого случая как по назначению, так и по количеству. На-пример, количество произведенной продукции за смену, еженедельные затраты на доставку сырья, количество исправных станков и т.п.
Постоянная (условно-постоянная) информация – это неизменная и многократно используемая в течение длительного периода времени информация. Постоянная информация может быть справочной, нормативной, плановой:
• постоянная справочная информация включает описание постоянных свойств объекта в виде устойчивых длительное время признаков. Например, табельный номер служащего, профессия работника, номер цеха и т.п.;
• постоянная нормативная информация содержит местные, отраслевые и общегосударственные нормативы. Например, размер налога на прибыль, стандарт на качество продуктов определенного вида, размер минимальной оплаты труда, тарифная сетка оплаты государственным служащим;
• постоянная плановая информация содержит многократно используемые в фирме плановые показатели. Например, план выпуска телевизоров, план подготовки специалистов определенной квалификации.
Функция управления. По функциям управления обычно классифицируют экономическую информацию. При этом выделяют следующие группы: плановую, нормативно-справочную, учетную и оперативную (текущую).
Плановая информация – информация о параметрах объекта управления на будущий период. На эту информацию идет ориентация всей деятельности фирмы.
Пример Плановой информацией фирмы могут быть такие показатели, как план выпуска продукции, планируемая прибыль от реализации, ожидаемый спрос на продукцию и т.д.
Нормативно-справочная информация содержит различные нормативные и справочные данные. Ее обновление происходит достаточно редко.
Пример 2.21. Нормативно-справочной информацией на предприятии являются:
• время, предназначенное для изготовления типовой детали (нормы трудоемкости);
• среднедневная оплата рабочего по разряду;
• оклад служащего;
• адрес поставщика или покупателя и т.д.
Учетная информация – это информация, которая характеризует деятельность фирмы за определенный прошлый период времени. На основании этой информации могут быть проведены следующие действия: скорректирована плановая информация, сделан анализ хозяйственной деятельности фирмы, приняты решения по более эффективному управлению работами и пр. На практике в качестве учетной информации может выступать информация бухгалтерского учета, статистическая информация и информация оперативного учета.
Пример Учетной информацией являются: количество проданной продукции за определенный период времени; среднесуточная загрузка или простой станков и т.п.
Оперативная (текущая) информация – это информация, используемая в оперативном управлении и характеризующая производственные процессы в текущий (данный) период времени. К оперативной информации предъявляются серьезные требования по скорости поступления и обработки, а также по степени ее достоверности. От того, насколько быстро и качественно проводится ее обработка, во многом зависит успех фирмы на рынке.
Пример 2.23. Оперативной информацией являются:
• количество изготовленных деталей за час, смену, день;
• количество проданной продукции за день или определенный час;
• объем сырья от поставщика на начало рабочего дня и т.д.
КЛЮЧЕВЫЕ ПОНЯТИЯ

 
Адекватность информации 
Вид информации:
внешняя 
внутренняя 
вторичная
входная
выходная
графическая 
первичная
переменная
постоянная
промежуточная
результатная
текстовая
Глубина классификации
Данные
Дескриптор
Значение фасета
Информация
Информационный объект
Информационные коммуникации 
Классификатор
Классификационный признак 
Классификация
Кодирование 
Количество информации
Коэффициент (степень) информативности
Мера измерения информации:
прагматическая
семантическая
синтаксическая
Объем данных
Показатель качества информации:
актуальность
достаточность
доступность
достоверность 
репрезентативность 
содержательность
своевременность
точность
устойчивость
Реквизит
Связь между дескрипторами:
ассоциативная
родо-видовая
синонимическая
Система классификации:
дескрипторная 
иерархическая
фасетная
Система кодирования
классификационная
параллельная
последовательная 
регистрационная
порядковая 
серийно-порядковая
Словарь дескрипторов
Тезаурус
Фасет
Форма адекватности:
прагматическая
семантическая
синтаксическая
Экономическая информация:
нормативно-справочная
оперативная
плановая
учетная
Энтропия системы

ВОПРОСЫ ДЛЯ САМОПРОВЕРКИ 
1. В чем различие информации и данных?
2. Что такое адекватность и в каких формах она проявляется?
3. Какие существуют меры информации и когда ими надо пользоваться?
4. Расскажите о синтаксической, семантической, прагматической мерах информации.
5. Какие существуют показатели качества информации?6. Что такое система классификации информации?
7. Основные идеи иерархического, фасетного, дескрипторного методов классификации. Примеры.
8. Что такое система кодирования информации? Классификация методов.
9. Что такое классификационное, регистрационное кодирование? Примеры.
10. Сопоставьте назначения системы классификации и системы кодирования.
11. Расскажите о классификации информации, циркулирующей в организации.


ЛИТЕРАТУРА
1. Гуменюк В.Е. Основы создания отраслевой системы ведения общесоюзных классификаторов технико-экономической информации Практ. Руководство. – М.: Финансы и статистика, 1985.
2. Научные основы организации управления и построения АСУ. / Под ред. В. Л. Бройдо, В. С. Крылова. – М.: Высшая школа, 1990
3. Пономарева К.В., Кузьмин Л.Г. Информационное обеспечение АСУ: – М.: Высшая школа, 1991.
4. Суханов А.П. Информация и прогресс. – Новосибирск: Наука, 1988.


Информация

Комментировать статьи на нашем сайте возможно только в течении 60 дней со дня публикации.

Популярные новости

Статистика сайта






 
Copyright © НеОфициальный сайт факультета ЭиП