Информационные процессы, кодирование и сбор информации
Информационные процессы, кодирование и сбор информации
Информационные процессы, кодирование и сбор информации
План
Информационные процессы
Кодирование информации
Сбор информации
Вывод
1. Информационные процессы
Если обратиться в далекое прошлое, то жалобы на обилие информации обнаруживаются тысячелетия назад.
Пример.
На глиняной дощечке (шумерское письмо IV тысячелетия до нашей эры) начертано: «Настали тяжелые времена. Дети перестали слушаться родителей, и каждый норовит написать книгу».
Особенно модным стало жаловаться на непереносимость информационного бремени с XVII века. В XX веке заговорили ни более ни менее, как об информационной катастрофе. Информационный кризис -- это возрастающее противоречие между объемом накапливаемой в обществе информации и ограниченными возможностями ее переработки отдельно взятой личностью. По оценкам специалистов в настоящее время количество информации, циркулирующей в обществе, удваивается примерно каждые 8-12 лет. Появилась уверенность в том, что для того, чтобы справиться с такой лавиной информации, недостаточно возможностей человеческого организма. Для этого нужны специальные средства и методы обработки информации, ее хранения и использования. Сформировались новые научные дисциплины -- информатика, кибернетика, бионика, робототехника и др., имеющие своей целью изучение закономерностей информационных процессов, то есть процессов, цель которых -- получить, передать, сохранить, обработать или использовать информацию.
В наиболее общем виде информационный процесс (ИП) определяется как совокупность последовательных действий (операций), производимых над информацией (в виде данных, сведений, фактов, идей, гипотез, теорий и пр.) для получения какого-либо результата (достижения цели).
Информация не существует сама по себе, она проявляется в информационных процессах.
Информационные процессы всегда протекают в каких-либо системах.
Информационные процессы могут быть целенаправленными или стихийными, организованными или хаотичными, детерминированными или вероятностными, но какую бы мы ни рассматривали систему, в ней всегда присутствуют информационные процессы, и какой бы информационный процесс мы ни рассматривали, он всегда реализуется в рамках какой-либо системы -- биологической, социальной, технической, социотехнической.
Пример.
«Танец» пчел -- процесс передачи информации от пчел-разведчиков пчелам-сборщикам меда. Обучение в школе -- это процесс передачи информации, накопленной предыдущими поколениями людей, подрастающему поколению.
Электронная почта (как совокупность соответствующих аппаратных средств и программ) предназначена для обеспечения передачи информации между компьютерами.
В зависимости от того, какого рода информация является предметом информационного процесса и кто является его субъектом (техническое устройство, человек, коллектив, общество в целом), можно говорить о глобальных информационных процессах, или макропроцесссах, и локальных информационных процессах, или микропроцессах.
Схема взаимосвязи информационных процессов показана на рис. 1., где линиями без стрелок показаны включения одних процессов в другие (нижних на схеме в верхние), а линиями со стрелками -- последовательность выполнения процессов.
Рис.1. Схема взаимосвязи информационных процессов
Пример.
Процесс познания, распространение информации посредством СМИ, информационные войны, организация архивного хранения информации -- глобальные ИП. Сравнение данных, двоичное кодирование текста, запись порции информации на носитель -- локальные ИП.
Наиболее общими информационными процессами являются три процесса: сбор, преобразование, использование информации.
Каждый из этих процессов распадается, в свою очередь, на ряд процессов, причем некоторые из последних могут входить в каждый из выделенных обобщенных процессов.
Так, сбор информации состоит из процессов поиска и отбора. В свою очередь поиск информации осуществляется в результате выполнения процедур целеполагания и использования конкретных методов поиска.
Методы поиска бывают «ручные» или автоматизированные. Они включают в себя такие процедуры, как формирование поискового образа (в явном или неявном виде), просмотр поступающей информации с целью сравнения её с поисковым образом.
Отбор информации производится на основе ее анализа и оценки ее свойств (объективность, достоверность, актуальность и пр.) в соответствии с выбранным критерием оценки. Отобранная информация сохраняется.
Хранение информации -- это распространение её во времени. Хранение информации невозможно без выполнения процессов кодирования, формализации, структурирования, размещения, относящихся к общему процессу преобразования информации.
В то же время кодирование, формализацию, структурирование можно вполне обоснованно отнести к процессам обработки информации. Наряду с вышеперечисленными к процессам обработки информации относятся также информационное моделирование, вычисления по формулам (численные расчеты), обобщение, систематизация, классификация, кластеризация, схематизация и т. п.
Обработка информации составляет основу процесса преобразования информации.
Информация может быть передана (распространена в пространстве) для её последующего использования, обработки или хранения. Процесс передачи информации включает в себя процессы кодирования, восприятия, расшифровки и пр.
Важнейшим процессом использования информации субъектом является процесс подготовки и принятия решений. Наряду с этим часто использование информации сводится к процессам формирования документированной информации (документов в том смысле, в каком этот термин используется в делопроизводстве) с целью подготовки информационного или управляющего воздействия.
Пример.
Бухгалтер на основании имеющихся первичных документов (накладных, нарядов, табелей учета времени, инструкций по налогообложению и пр.) составляет сводную ведомость.
Сообщение о крупной аварии может стать основой для подготовки пакета документов о введении чрезвычайного положения.
В реальной практике широко используются процедуры, входящие в процесс защиты информации. Защита информации -- важный компонент процессов хранения, обработки, передачи информации в системах любого типа, особенно в социальных и технических системах. К ней относятся разработка кода (шифра), кодирование (шифрование), сравнение, анализ, паролирование и т. п.
После того, как процесс использования информации завершен, например, решение принято и субъект приступил к его реализации, как правило, возникает новая задача и необходимы новая информация либо уточнение уже имеющейся. Это приводит к тому, что субъект вновь обращается к процедуре сбора информации и пр. Поэтому, говоря об информационных процессах, следует подчеркивать не только их взаимосвязь, но и цикличность. Отсюда ясно происхождение понятий «информационный цикл», «жизненный цикл информации».
Человек всегда стремится автоматизировать выполнение рутинных операций и операций, требующих постоянного внимания и точности. То же справедливо и по отношению к информационным процессам.
Универсальным устройством для автоматизированного выполнения информационных процессов в настоящее время является компьютер. Немалую роль в этом играют вычислительные системы и сети.
2. Кодирование информации
Информационный процесс кодирования информации встречается в нашей жизни на каждом шагу. Любое общение между людьми происходит именно благодаря тому, что они научились выражать образы, чувства и эмоции с помощью специально предназначенных для этого знаков и сигналов -- звуков, жестов, букв и пр.
Одну и ту же информацию мы можем выразить разными способами.
Пример. Каким образом можно сообщить об опасности?
1. Если на вас напали, вы можете просто крикнуть «Караул!» (англичанин крикнет «Help me!»).
2. Если имеется прибор под высоким напряжением, то требуется оставить предупреждающий знак (рисунок черепа или молнии).
3. На оживленном перекрестке регулировщик помогает избежать аварии с помощью жестов.
4. Если ваш корабль тонет, то вы передадите сигнал «SOS» (... - - - ...); для этих целей на флоте могут использовать также семафорную и флажковую сигнализацию.
В каждом из этих примеров необходимо знать правило, по которому отображается информация, правило кодирования. Такое правило назовем кодом.
Код (фр. code -- кодекс, свод законов). Начиная с середины XIX века это слово, помимо основного значения, означало книгу, в которой словам естественного языка сопоставлены группы цифр или букв.
Чаще всего кодирование -- это процесс представления информации в виде знаков (поскольку дискретные сигналы воспринимать и обрабатывать проще, чем непрерывные).
Знак вместе с его смыслом называют символом.
Используемый для кодирования конечный набор отличных друг от друга знаков называется алфавитом.
Существует множество алфавитов.
* алфавит кириллических букв {А, Б, В, Г, Д, Е, ...};
* алфавит латинских букв {А, В, С, D, E, F, ...};
* алфавит десятичных цифр {0, 1, 2, 3, 4, 5, 6, 7, 8, 9};
*алфавит знаков зодиака {?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?}
* набор знаков азбуки Брайля для слепых;
* набор китайских идеограмм;
* математическая символика и др.;
* набор знаков генетического кода {А, Ц, Г, Т}. Важнейшие технические коды для кодирования текстов,
записанных на естественных языках, возникли с появлением электрического телеграфа, например:
* азбука Морзе;
* набор знаков второго международного телеграфного кода (телекс).
При кодировании информации для технических устройств особенно важное значение имеют наборы, состоящие всего из двух знаков: {+, -}; {*, -}; {0, 1}; {да, нет}.
Алфавит, состоящий из двух знаков, называют двоичным, а каждый знак из этого алфавита -- двоичным знаком.
Кодирование используется для представления информации в виде, удобном для хранения и передачи. Рассмотрим простейшие задачи кодирования и декодирования.
Пример. Попробуем закодировать числа от 0 до 100, не используя арабских или римских цифр.
Прежде всего необходимо придумать алфавит или выбрать какой-либо из известных.
Можно ли использовать в качестве «букв» алфавита знаки или гласные буквы русского алфавита?
Да, можно выбрать любой набор отличающихся друг от друга знаков.
Каждому числу, которое нужно закодировать, поставим в соответствие одну «букву» выбранного нами алфавита. Например:
Во всех трех случаях из приведённого примера мы не решили поставленной задачи. Мы не смогли закодировать числа от 0 до 100, используя предложенные алфавиты. Получается, что наш алфавит обязательно должен состоять из 101 знака? Но с помощью всего десяти арабских цифр вы можете записать любое число. А римских цифр для кодирования первых 101 числа требуется всего пять: I, V, X, L, С.
Нужен другой подход, другое правило.
Покажем, что используя всего три символа, например , можно закодировать (зашифровать, представить) любое число. Для этого каждое число будем представлять не одним, а несколькими символами из нашего алфавита.
В нашем правиле кодирования появляется понятие «длина кода».
Длиной кода назовем количество знаков, которое используется для представления кодируемого числа (или слова).
То есть термин «код» используется в двух смыслах -- как правило кодирования и как набор знаков для кодирования некоторого символа.
Количество знаков в алфавите кодирования и длина кода -- совершенно разные вещи. Например, в русском алфавите 33 буквы, а слова могут быть длиной в 1, 2, 3, ... буквы.
Посмотрим, сколько чисел мы можем закодировать, если длина кода составляет не более 2 знаков.
Воспользуемся правилом, схематично представленным на рис. 2.
Рис. 2. Схематичное представление правила кодирования
Если посмотреть на схему, то видно, что на первое место в каждом коде ставится код предыдущего уровня, а к нему дописываются по одному все знаки алфавита в заданном алфавитном порядке. Такое правило кодирования позволяет перебрать все возможные коды и никогда не повториться.
Из таблицы (справа от рис. 2) видно, что при длине кода не более 2 знаков всего можно закодировать 12 (3 + 9) разных чисел. Чтобы закодировать числа 12, 13, ..., следует увеличить длину кода.
Пример.
Рассмотрим задачу, обратную к задаче кодирования из предыдущего примера. Есть закодированная информация:. Коды вам известны. Длина кода -- не более 2 знаков. Определите исходное число. Так как длина кода может быть 1 или 2, то
* могли быть закодированы три числа -- 1, 2, 0;
* могли быть закодированы два числа -- 1, 9;
* могли быть закодированы два числа -- 8, 0.
Все три решения справедливы. Как вы думаете, почему? Есть ли способ, который приведет нас к однозначному решению поставленной задачи?
Коды переменной (непостоянной) длины в технике встречаются довольно редко. Исключением является лишь код Морзе.
Пример. Взгляните на международную азбуку Морзе:
Для отправителя приведенная таблица выглядит вполне логично, ибо буквы в ней расположены в алфавитном порядке. Но для человека, получающего сообщения, она неудобна.
В каком же порядке следует расположить знак азбуки Морзе, чтобы получив сигнал, мы могли, не теряя времени, определить, какой букве он соответствует. Представим азбуку Морзе в виде дерева:
При получении сигнала -- это либо точка, либо тире -- записываем букву и спускаемся по дереву: если точка -- влево от текущей вершины, если тире -- вправо, если пауза -- записываем букву текущей вершины, если длинная пауза -- записываем букву и отмечаем конец слова.
По общепринятому правилу радистов продолжительность передачи точки равна продолжительности паузы, продолжительность передачи тире равна продолжительности передачи трех точек, продолжительность передачи пропуска (между буквами) равна продолжительности трех пауз.
Азбука Морзе -- это пример троичного кода с набором знаков «точка», «тире», «пауза». Паузу в качестве разделителя между буквами и словами необходимо использовать, так как длина кода непостоянна.
В кодах с постоянной длиной закодированные символы могут следовать друг за другом непосредственно, без всяких разделителей. Местоположение этих символов устанавливается с помощью отсчета. И таким образом сообщение может быть раскодировано однозначно.
Наиболее простым для кодирования является двоичный алфавит. Чем меньше знаков в алфавите, тем проще должна быть устроена «машина» для распознавания (дешифровки) информационного сообщения. Однако чем меньше знаков в алфавите, тем большее их количество (большая длина кода) требуется для кодирования информации.
Вернемся к примеру с кодированием чисел. Будем использовать для представления (кодирования) чисел от 0 до 100 алфавит и код постоянной длины. Какова должна быть длина кода?
В случае, когда длина кода равна п, с помощью алфавита, состоящего из 3 знаков, можно закодировать 3n различных состояний (чисел, букв, комбинаций). Приведем одно из возможных объяснений. В каждой из п позиций может стоять один из 3-х знаков алфавита. Для первой позиции существует 3 возможности. Для каждой из этих возможностей рассмотрим 3 возможности для второй позиции -- всего будем иметь 3*3 = 9 возможностей. Рассуждая далее аналогично для остальных позиций, получим возможностей (комбинаций, состояний) расположения 3-х знаков в п позициях. Знаками двоичного алфавита можно закодировать 2n различных состояний; если имеется алфавит, состоящий из k знаков, то можно закодировать kn различных состояний.
Итак, если алфавит состоит из k знаков и используется код с постоянной длиной п, то можно закодировать различных состояний.
Пример.
Определим, какой длины должен быть код, чтобы, используя разные алфавиты, закодировать 10, 33, 100, 200, 1000 различных символов.
Проанализируйте таблицу:
Итак, для кодирования М различных символов кодом постоянной длины с помощью алфавита из k знаков, требуется длина кода (с учетом того, что длина кода -- это целое число), равная
В вычислительной технике для кодирования информации используется двоичный алфавит {0,1}. Это позволяет использовать достаточно простые устройства для представления и автоматического распознавания (дешифровки, декодирования) программ и данных. Конструкция декодирующего устройства максимально упрощается, ведь оно должно уметь различать всего два состояния (например, 1 -- есть ток в цепи, 0 -- тока в цепи нет). По этой причине двоичная система и нашла такое широкое применение.
В вычислительной технике в настоящее время широко используется двоичное кодирование с алфавитом {0,1}. Наиболее распространенными кодами являются ASCII (American standard code for information interchange -- американский стандартный код для обмена информацией), ДКОИ-8, Win1251.
Передача сообщений всегда осуществляется во времени. Процесс кодирования также требует определенного количества времени, которым зачастую нельзя пренебрегать. При кодировании могут ставиться определенные цели и применяться различные методы. Наиболее распространенные цели кодирования:
* экономность (уменьшение избыточности сообщения, повышение скорости передачи или обработки);
* надежность (защита от случайных искажений);
* сохранность (защита от нежелательного доступа к информации);
* удобство физической реализации (двоичное кодирование информации в ЭВМ);
* удобство восприятия (схемы, таблицы).
Одно и то же сообщение можно закодировать разными способами, то есть выразить на разных языках. В процессе развития человеческого общества люди выработали большое число языков кодирования.
К ним относятся:
* разговорные языки (русский, английский, хинди и др., всего более 2000);
* язык мимики и жестов;
* язык рисунков и чертежей;
* языки науки (языки математики, химии и т. д.);
* языки искусства (языки музыки, живописи, скульптуры);
* специальные языки (эсперанто, морской семафор, азбука Морзе, азбука Брайля для слепых и т. д.);
Среди специальных языков особо выделим языки программирования.
Программирование -- кодирование информации на языке, «понятном» компьютеру.
Задачи, связанные с кодированием и декодированием сообщений, изучаются в теории кодирования -- одном из разделов теории информации.
3. Сбор информации
Поиск информации -- один из важных информационных процессов. От того, как он организован, во многом зависит своевременность и качество принимаемых решений.
В широком плане поиск является основой познавательной деятельности человека во всех ее проявлениях: в удовлетворении любопытства, путешествиях, научной работе, чтении и т. п. В более узком смысле поиск означает систематические процедуры в организованных хранилищах информации: библиотеках, справочниках, картотеках, электронных каталогах, базах данных.
Пример.
«Всё, иду сегодня в театр», -- твердо решили вы в одно прекрасное воскресное утро. -- «Узнать бы, какой сегодня спектакль!».
Итак, цель определена: выяснить автора и название пьесы. Как будет решаться поставленная задача?
Ваши возможные действия
|
Вполне возможный результат
|
|
1. Поискали газету, где, кажется, был еженедельный репертуар
|
Не нашли
|
|
2. Вспомнили, что в 7.40 по радио обычно передают театральную афишу
|
Обнаружили, что ваши часы показывают уже 8.10
|
|
3. Позвонили по телефону другу-театралу, который уж точно в курсе
|
Друга не оказалось дома
|
|
4. «Ну уж справочная-то все знает!», -- решили вы, набирая на телефоне номер 09
|
«Таких справок не даем», -- огорченно слышите в ответ
|
|
|
Вы затратили время и энергию, а задачу не решили. Это -- результат неэффективно организованного поиска информации.
Пример.
Вы задумались о том, какую профессию выбрать, и решили, что она должна быть связана с производством и использованием компьютеров. Какие это профессии, в каком учебном заведении и на каком факультете можно приобрести такую специальность, вы пока не знаете. Первое, чем вам придется заняться, -- это поиск информации.
Что вы можете предпринять?
|
Ожидаемый результат
|
Этап поиска
|
|
Поговорить с родителями
|
Получение совета с чего начать + психологическая поддержка
|
Определение направления поиска
|
|
Обратиться в профориентационный центр
|
Получение перечня профессий, отвечающих вашим интересам
|
Предварительное знакомство
|
|
Взять в библиотеке справочник для поступающих в вузы
|
Получение краткой информации о вузах, факультетах и специальностях. Выбор адресов
|
Конкретизация информации
|
|
Послать запросы в приемные комиссии выбранных вузов
|
Получение рекламных проспектов и условий приема в данный вуз
|
Уточнение информации
|
|
Побеседовать со студентами или выпускниками выбранного факультета
|
Получение субъективных и эмоциональных оценок их специальности (профессии)
|
Углубление полученных представлений
|
|
Хорошенько все обдумать и обсудить ситуацию с родителями
|
Укрепление своего решения или отказ от него и возврат к началу
|
Анализ полученной информации
|
|
|
Успех вашего выбора в большой степени будет зависеть от того, как вы организовали поиск информации.
Используйте разнообразные методы поиска информации, это поможет вам собрать более полную информацию и повысит вероятность принятия вами правильного решения.
Методы поиска информации:
* непосредственное наблюдение;
* общение со специалистами по интересующему вас вопросу;
* чтение соответствующей литературы;
* просмотр видео-, телепрограмм;
* прослушивание радиопередач и аудиокассет;
* работа в библиотеках, архивах;
* запрос к информационным системам, базам и банкам компьютерных данных;
* другие методы.
В процессе поиска вам может встретиться самая разная информация. Любую информацию человек привык оценивать по степени ее полезности, актуальности и достоверности. После оценки какие-то полученные сведения могут быть отброшены как ненужные, какие-то, наоборот, оставлены на долгое хранение. То есть процесс поиска информации практически всегда сопровождается ее отбором. Всё это вместе называют процессом сбора информации.
Чтобы не утонуть в «море информации», учитесь отбирать только информацию, полезную для решения стоящей перед вами задачи. Не уподобляйте свою голову мусорному ящику, куда сваливают всё без разбора.
Понять, что искать, столкнувшись с той или иной жизненной ситуацией, грамотно осуществить процесс сбора информации -- вот умения, которые становятся решающими в информационном обществе.
С информацией, которую мы ищем, всегда ассоциируется некоторая известная нам информация, которая в виде ключа или поискового предписания служит опорой для поиска и отбора информации.
Пример.
Вы хотите в адресном бюро узнать адрес человека. Известные вам фамилия, имя, отчество и возраст ассоциируются с неизвестным нам адресом и служат ключом к его поиску.
В библиотечном деле термин «поиск информации» имеет родственное, но всё-таки другое значение. Он относится к методам отыскания (например, с помощью ключевых слов и индексов) текстов или ссылок на работы по некоторой теме.
Для ускорения процесса получения наиболее полной информации по интересующему вопросу в хранилищах информации стали составлять каталоги (алфавитный, предметный и др.). Но если вспомнить библиотечный каталог, то понятно, что из его карточки можно очень мало почерпнуть о содержании того документа, который она представляет. В лучшем случае -- название, фамилии авторов, год и место издания, краткую аннотацию. Следующим шагом в ускорении поиска информации стало создание специальных реферативных (обзорных) журналов.
Подлинный переворот в службе хранения, отбора информации произвели автоматизированные информационно-поисковые системы (ИПС). Использование ИПС (электронного каталога) позволяет сэкономить время и усилия, затрачиваемые на просмотр ящиков, заполненных карточками. Кроме того, появляется возможность существенно сократить пространство хранилищ, отводимое для размещения самих каталогов.
Вывод
Информационный процесс -- совокупность последовательных действий (операций), производимых над информацией (в виде данных, сведений, фактов, идей, гипотез, теорий и пр.) для получения какого-либо результата (достижения цели).
Информация проявляется именно в информационных процессах.
Информационные процессы всегда протекают в каких-либо системах (социальных, социотехнических, биологических и пр.).
Наиболее общими информационными процессами являются сбор, преобразование, использование информации.
К основным информационным процессам, изучаемым в курсе информатики, относятся: поиск, отбор, хранение, передача, кодирование, обработка, защита информации.
Информационные процессы, осуществляемые по определенным информационным технологиям, составляют основу информационной деятельности человека.
Компьютер является универсальным устройством для автоматизированного выполнения информационных процессов.
Знак вместе с его смыслом называют символом. Используемый для кодирования конечный набор отличных друг от друга знаков называется алфавитом.
Алфавит, состоящий из двух знаков, называется двоичным алфавитом.
Кодированием называется процесс преобразования одного набора знаков в другой набор знаков.
Кодом называется правило для преобразования одного набора знаков в другой набор знаков.
Кодирование используется при хранении, передаче информации, представлении ее на носителе.
Длиной кода называется количество знаков, которое используется для представления кодируемого символа.
Код может быть постоянной и переменной длины.
Если длина кода равна п, то с помощью алфавита, состоящего из k знаков, можно закодировать различных состояний.
Для кодирования М различных состояний кодом постоянной длины с помощью алфавита из k знаков, требуется длина кода, равная
В вычислительной технике в настоящее время широко используется двоичное кодирование с алфавитом {0,1}. Наиболее распространенными кодами являются ASCII, ДКОИ-8, Win1251.
Сбор информации состоит из процессов поиска и отбора информации.
Сбор информации всегда осуществляется с определенной целью, которая во многом определяет выбор методов поиска и критерии отбора найденной информации.
Методы поиска информации:
* непосредственное наблюдение;
* общение со специалистами по интересующему вас вопросу;
* чтение соответствующей литературы;
* просмотр видео-, телепрограмм;
* прослушивание радиопередач и аудиокассет;
* работа в библиотеках, архивах;
* запрос к информационным системам, базам и банкам компьютерных данных;
* другие методы.
Поиск информации всегда сопровождается её отбором.
Отбор информации предполагает оценку найденной информации по степени полезности, актуальности, достоверности и выбор только информации, полезной для решения поставленной задачи.
|