Информационные ресурсы Интернет, относящиеся к области бизнеса и коммерции
Информационные ресурсы Интернет, относящиеся к области бизнеса и коммерции
ПОВОЛЖСКАЯ АКАДЕМИЯ ГОСУДАРСТВЕННОЙ СЛУЖБЫ
КУРСОВАЯ РАБОТА
по теме
«Информационные ресурсы Интернет, относящиеся к области бизнеса и коммерции»
по дисциплине «Мировые информационные ресурсы.»
ВЫПОЛНИЛ
Студент третьего курса
Заочного отделения
Специальности 3514
«Прикладная информатика в управлении»
Щербаков Л.В.
ПРОВЕРИЛ:
Воронин В.Е.
Г. Саратов.
2001г.
СОДЕРЖАНИЕ
1. Основы работ с базами данных
2. Некоторые сведения о типах данных
3. Интерфейс БД.
4. Текстовые базы данных.
5. Сетевые базы данных.
6. Реляционные базы данных.
7. Проектирование баз данных
8. Анализ предметной области и запросов к БД.
9. Анализ концептуальных требований
10. Выявление информационных объектов
и связей между ними
11. Построение концептуальной модели
12. Логическое проектирование
13. Выбор конкретной СУБД
14. Выбор языка манипулирования данными
Данная работа посвящена анализу работы с базами данных, а также освещению методов построения форм и отчетов на примере построения программы ведения электронной документации учебного заведения (отдел кадров, учётные записи). В качестве инструмента построения базы данных использован Microsoft Access. С самого начала эту СУБД отличала простота использования в сочетании с широкими возможностями по разработке законченных приложений.
1. Основы работ с базами данных.
В настоящее время, несмотря на повышение компьютеризации общества, в сфере образования до сих пор нет средств, позволяющих в достаточной мере автоматизировать процесс ведения документации и отчетности.
Одной из составных задач можно рассматривать проблему ведения эффективного учёта всех записей отдела кадров по преподавателям и студентам, а так же оперативную корректировку данных при возникновении необходимости в этом.
О своевременности и актуальности рассматриваемой проблемы говорит тот факт, что большую часть своего времени администраторы заведений и преподаватели тратят на оформление различной документации и отчетов. Огромное количество учебных заведений и отсутствие предложений в данной сфере гарантируют высокую потребность в данном продукте.
Базы данных (БД) составляют в настоящее время основу компьютерного обеспечения информационных процессов, входящих практически во все сферы человеческой деятельности.
Действительно, процессы обработки информации имеют общую природу и опираются на описание фрагментов реальности, выраженное в виде совокупности взаимосвязанных данных. Базы данных являются эффективным средством представления структур данных и манипулирования ими. Концепция баз данных предполагает использование интегрированных средств хранения информации, позволяющих обеспечить централизованное управление данными и обслуживание ими многих пользователей. При этом БД должна поддерживаться в среде ЭВМ единым программным обеспечением, называемым системой управления базами данных (СУБД). СУБД вместе с прикладными программами называют банком данных.
Одно из основных назначений СУБД - поддержка программными средствами представления, соответствующего реальности.
Предметной областью называется фрагмент реальности, который описывается или моделируется с помощью БД и ее приложений. В предметной области выделяются информационные объекты - идентифицируемые объекты реального мира, процессы, системы, понятия и т.д., сведения о которых хранятся в БД.
2. Некоторые сведения о типах данных
Этапам реализации баз данных соответствуют уровни описания предметной области: реальность в том виде, как она существует; концептуальное описание реальности; представление описания в виде формального текста и физическая реализация БД на машинных носителях.
Для ввода в ПК полученное описание должно быть представлено в терминах специального языка описания данных, который входит в комплекс средств СУБД.
Простое (элементарное) данное - это наименьшая семантически значимая поименованная единица данных (например, ФИО, должность, адрес и т.д.). Значения простого данного описывает представленную им характеристику объекта для каждого экземпляра объекта. Имена простых данных хранятся в описании БД, в то время как их значения запоминаются в самой БД.
Совокупность простых данных можно объединить в составное данное двумя способами. Во-первых, можно соединить несколько разнотипных данных. Например, данное АНКЕТА состоит из данных ТАБЕЛЬНЫЙ НОМЕР, ФИО, ГОД РОЖДЕНИЯ, ПОЛ, ДОЛЖНОСТЬ, ЗАРПЛАТА. По этому принципу образуется структурное данное или данное типа структура. Описание структуры состоит из перечисления ее составных частей, значение - из значений составляющих ее данных. Во-вторых, составное данное может объединять совокупность однотипных данных(список сотрудников, послужной список сотрудника и т.п.). Составное данное этого типа называется массивом.
В общем случае составные данные представляют собой объединенную под одним именем совокупность данных любых типов, в том числе структур и массивов, с произвольной глубиной вложенности составных данных (рис.1).
Элементы массива могут идентифицироваться ключом - данным, значения которого взаимно однозначно определяют экземпляры элементов.
Составные типы данных представляют иерархические связи значений данных в БД. Представление предметной области в виде структур данных с иерархическими связями носит название иерархической модели данных. В общем случае в базе могут быть определены также сетевые связи, позволяющие описать сеть - ориентированный граф произвольного вида. Представление предметной области в виде сетевых структур данных общего вида называется сетевой моделью данных. Сетевые связи реализуются путем отождествления отдельных данных БД.
Процесс построения концептуального описания с учетом всех необходимых факторов называется процессом проектирования БД.
Послужной список
Анкета
Зарплата
Дата Работа
Таб.номер Должность
ФИО Пол Должность Организация
Год рождения
Массив
Структура
Сотрудники
Анкета
Зарплата
Таб. номер
Послужной список
ФИО
Дата
Дата Работа
рождения
Число
Должность Организация
Месяц Год
Многоуровневое данное Рис.1
3. Интерфейс БД.
Интерфейс определяет переход от представления данных в БД к представлению, принятому среди пользователей, и обратно. В общем случае пользователи представляют данные в виде документов различных видов, от произвольных текстов до справок и таблиц фиксированного формата.
Интерфейс доступа конечного пользователя охватывает комплекс технических, организационных и программных решений, обеспечивающих в итоге унифицированность, хорошую понимаемость и надежность взаимодействия конечного пользователя с различными моделями персональных компьютеров.
Под документом понимается произвольный структурированный текст, который может быть представлен на алфавитно - цифровых печатающих устройствах. При этом под структурой текста понимается структура взаимосвязей данных, составляющих текст.
В процессе проектирования, как правило, возникает необходимость точного учета структур документов. Для полного представления этих структур могут использоваться средства описания данных БД. Тем самым облегчается процесс сопоставления БД и документов при организации интерфейса.
Совместная реализация БД и интерфейса на единой концептуальной основе предполагает сопоставление соответствующих понятий концептуального описания с понятиями пользователей.
Конкретные функциональные требования пользователей и предполагаемое их обеспечение отображаются понятием пользовательского представления данных. В общем случае пользовательское представление включает так называемое локальное внешнее представление функций обработки данных, а также определение форматов входных и выходных данных.
База данных (БД) - именованная совокупность данных, отражающая состояние объектов и их отношений в рассматриваемой предметной области;
- система управления базами данных (СУБД) - совокупность языковых и программных средств, предназначенных для создания, ведения и совместного применения БД многими пользователями;
- банк данных (БнД) - основанная на технологии БД система программных, языковых, организационных и технических средств, предназначенных для централизованного накопления и коллективного использования данных;
- информационная система (ИС) - система, реализующая автоматизированный сбор, обработку и манипулирование данными и включающая технические средства обработки данных, программное обеспечение и соответствующий персонал.
Функционально - полная СУБД должна включать в свой состав средства, обеспечивающие потребности пользователей различных категорий на всех этапах жизненного цикла систем БД: проектирования, создания, эксплуатации.
БАЗЫ ДАННЫХ
Текстовые базы данных.
Объектами хранения в текстовых БД являются тексты. Под текстом будут пониматься неструктурированные данные, построенные из строк.
Основной целью любой текстовой БД является хранение, поиск и выдача документов, соответствующих запросу пользователя. Такие документы принято называть релевантными. Ввиду того, что автоматизированный поиск документов на естественных языках достаточно затруднен, возникает вопрос о проектировании некоторых формальных языков, предназначенных для отображения основного смыслового содержания документов и запросов в БД.
Такие языки называют информационно-поисковыми. В настоящее время разработано достаточно большое количество информационно-поисковых языков, которые отличаются не только по своим изобразительным свойствам, но и по степени семантической силы.
В основе подхода к построению классификационных языков лежит представление о том, что накопленные знания могут быть разделены на взаимоисключающие классы и подклассы. Существует система правил, которой должен подчиняться любой язык классификационного типа, в частности:
Деление отраслей знаний на классы и подклассы проводится по одному основанию;
Подклассы должны исключать друг друга;
При делении классов на подклассы должна соблюдаться непрерывность.
Информационно - поисковые языки, получившие название дескрипторных, основаны на применении принципов координатного индексирования, при котором смысловое содержание документа может быть с определенной степенью точности и полноты задано списком ключевых слов, содержащихся в тексте.
Дескрипторные языки привязаны к лексике текстов. Ключевые слова из текстов выбираются исходя из разных целей, соответственно, критерии выбора могут различаться. Для построения дескрипторного языка критерием отбора ключевых слов, как правило, служат информативность слова и частота его встречаемости в тексте.
Универсальными структурами дескрипторного языка являются лексические единицы, парадигматические и синтагматические отношения.
Лексическая единица - наименьшая смысловая единица, задаваемая при построении языка.
В большинстве автоматизированных информационных систем при индексировании документов и запросов применяется контроль с помощью тезауруса. Контроль может осуществляться в автоматизированном или ручном режиме. По сути дела тезаурус представляет собой словарь - справочник, в котором присутствуют все лексические единицы дескрипторного информационно поискового языка с введенными парадигматическими отношениями. Парадигматические отношения могут задаваться как:
Отношения вид - род (вышестоящий дескриптор);
Отношения род - вид (нижестоящие дескрипторы);
Синонимы;
Ассоциативные связи
В тезаурусы помещаются дескрипторы и недескрипторы, хотя существуют тезаурусы только из дескрипторов.
Как дескрипторы, так и недескрипторы приводят к единой грамматической форме. Как правило, дескрипторы употребляются в форме существительных или именных словосочетаний. Тезаурус может быть построен по принципу дескрипторных статей, состоявших из заглавного дескриптора и списка дескрипторов и недескрипторов с обозначением парадигматических отношений. Тезаурус может быть двуязычным. В этом случае эквивалентный дескриптор на иностранном языке должен быть обозначен.
Парадигматические отношения представляют собой внетекстовые отношения между лексическими единицами. На их основании происходит группировка лексических единиц в парадигмы.
Синтагматические отношения представляют собой отношения лексических единиц в тексте, т.е. они выражают семантику контекста.
При переводе основного смыслового содержания документов и запросов с естественного языка на дескрипторный информационно - поисковый язык существуют определенные правила, называемые системой индексирования. Результатом перевода документа является поисковый образ документа, а запроса - поисковый образ запроса.
Из перечисленных информационно - поисковых языков именно дескрипторные языки наилучшим образом приспособлены для описания документов и запросов при автоматизированном поиске в текстовых БД. Языки эти обладают таким преимуществом, как гибкость, открытость, близость к естественному языку; это языки двухуровневые (уровень ключевых слов и уровень дескрипторов). Дескрипторные информационно - поисковые языки позволяют формулировать документы и запросы в разных терминах. К основным недостаткам языков данного класса можно отнести недостаточную полноту описания смыслового содержания документов и запросов.
Системы, контролируемые тезаурусом, содержат процедуры как морфологического, так и синтаксического анализа текстов. Однако при проектировании ряда БД возникает необходимость в добавлении еще одного этапа анализа текста на естественном языке - анализа его семантической структуры. Примером таких баз могут быть БД, ориентированные на поиск по образцам. В подобных семантических системах пытаются моделировать процесс понимания законченных описаний фрагментов действительности, например патентов, рассказов, эпизодов и др., выраженных в виде текстов. Как правило, понимание текста трактуется как процесс извлечения из него существенной с точки зрения системы информации. Извлеченная информация вводится в базу знаний, представляющую собой динамическую информационную модель реального мира. Затем система способна отвечать на запросы относительно событий, фактов, явлений, изложенных в текстах.
Пакеты прикладных программ, предназначенные для ввода, обработки, поиска и обновления текстов, называют информационно-поисковой системой (ИПС).
5. Сетевые базы данных.
Одним из наиболее эффективных методов представления знаний являются сетевые модели.
В основе моделей лежит понятие сети, вершинами которой являются понятия, соответствующие объектам, событиям, процессам, явлениям, а дугами - отношения между этими понятиями.
Узлы и связи можно наглядно изображать в виде диаграмм.
Если вершины сети не имеют своей внутренней структуры, то сеть будет простой. Если же вершины обладают некоторой структурой в виде сети, то сеть называется иерархической. Если отношения между вершинами одинаковые, то сеть однородна, в противном случае - сеть неоднородна. Характер отношений, приписываемый дугам, может быть различен. В соответствии с этим выделяют следующие типы сетей:
Функциональные сети отражают декомпозицию определенной вычислительной или информационной процедуры, а дуги показывают функциональную связь между декомпонированными частями; этот язык недостаточно богат для представления знаний;
Сценарии, представляющие собой однородные сети с единственным отношением в виде нестрогого порядка. Семантика отношений может быть различной. Отношение может трактоваться как классифицирующее, временное и т.п. Сценарии часто используются при формировании допустимых планов по достижению цели;
Семантические сети используют отношения разных типов, а вершины в них могут иметь разную интерпретацию, По сути дела семантическая сеть является классом, в который включаются как сценарии, так и функциональные сети. Наиболее часто используются в сети связи типа «это есть». Они позволяют построить в виде сети иерархию понятий, в которых узлы низших уровней наследуют свойства узлов более высоких уровней. Именно таким механизмом переноса свойств обусловлена эффективность семантических сетей.
6. Реляционные базы данных.
Базы данных называются реляционными, если управление ими основано на математической модели, использующей методы реляционной алгебры и реляционного исчисления. С. Дейт дает следующее неформальное определение реляционных баз данных:
Вся информация в базе данных представлена в виде таблиц.
Поддерживаются три реляционных оператора - выбора, проектирования и объединения, с помощью которых можно получить любые необходимые данные , заложенные в таблицы.
Доктор И.Ф. Кодд, автор реляционной модели, разработал целый список критериев, которым должна удовлетворять реляционная модель. Описание этого списка, часто называемого «12 правилами Кодда», требует введения сложной терминологии и выходит за рамки дипломной работы. Тем не менее можно назвать некоторые правила Кодда для реляционных систем. Чтобы считаться реляционной по Кодду, система управления базами данных должна:
Представлять всю информацию в виде таблиц;
Поддерживать логическую структуру данных, независимо от их физического представления;
Использовать язык высокого уровня для структурирования, выполнения запросов и изменения информации в базах данных;
Поддерживать основные реляционные операции (выбор, проектирование и объединение), а также теоретико-множественные операции, такие как объединение, пересечение и дополнение;
Поддерживать виртуальные таблицы, обеспечивая пользователям альтернативный способ просмотра данных в таблицах;
Различать в таблицах неизвестные значения (nulls), нулевые значения и пропуски в данных;
Обеспечивать механизмы для поддержки целостности, авторизации, транзакций и восстановления данных.
Первое правило Кодда гласит, что вся информация в реляционных базах данных представляется значениями в таблицах. В реляционных системах таблицы состоят из горизонтальных строк и вертикальных столбцов. Все данные представляются в табличном формате - другого способа просмотреть информацию в базе данных не существует. Набор связанных таблиц образует базу данных. Таблицы в реляционной базе разделены, но полностью равноправны. Между ними не существует никакой иерархии.
Каждая таблица состоит из строк и столбцов. Каждая строка описывает отдельный объект или сущность - ученика, предмет, день недели или что-нибудь другое. Каждый столбец описывает одну характеристику объекта - имя или фамилию ученика, его адрес, оценку, дату. Каждый элемент данных, или значение, определяется пересечением строки и столбца. Чтобы найти требуемый элемент данных, необходимо знать имя содержащей его таблицы, столбец и значение его первичного ключа, или уникального идентификатора.
В реляционной базе данных существует два типа таблиц - пользовательские таблицы и системные таблицы. Пользовательские таблицы содержат информацию, для поддержки которой собственно и создавались реляционные базы данных. Системные таблицы обычно поддерживаются самой СУБД, однако доступ к ним можно получить так же, как и к любым другим таблицам. Возможность получения доступа к системным таблицам, по аналогии с любыми другими таблицами, составляет основу другого правила Кодда для реляционных систем.
Реляционная модель обеспечивает независимость данных на двух уровнях - физическом и логическом. Физическая независимость данных означает с точки зрения пользователя, что представление данных абсолютно не зависит от способа их физического хранения. Как следствие этого, физическое перемещение данных никоим образом не может повлиять на логическую структуру базы данных. Другой тип независимости, обеспечиваемый реляционными системами - логическая независимость - означает, что изменение взаимосвязей между таблицами и строками не влияет на правильное функционирование программных приложений и текущих запросов.
В определении системы управления реляционными базами данных упоминаются три операции по выборке данных - проектирование, выбор и объединение, которые позволяют строго указать системе, какие данные необходимо показать. Операция проектирования выбирает столбцы, операция выбора - строки, а операция объединения собирает вместе данные из связанных таблиц.
Виртуальные таблицы можно рассматривать как некоторую перемещаемую по таблицам рамку, через которую можно увидеть только необходимую часть информации. Виртуальные таблицы можно получить из одной или нескольких таблиц базы данных ( включая и другие виртуальные таблицы), используя любые операции выбора, проектирования и объединения. Виртуальные таблицы, в отличие от «настоящих», или базовых таблиц, физически не хранятся в базе данных. В то же время необходимо осознавать, что виртуальные таблицы это не копия некоторых данных, помещаемая в другую таблицу. Когда вы изменяете данные в виртуальной таблице, то тем самым изменяете данные в базовых таблицах. В идеальной реляционной системе с виртуальными таблицами можно оперировать как и с любыми другими таблицами. В реальном мире на виртуальные таблицы накладываются определенные ограничения, в частности на обновление. Одно из правил Кодда гласит, что в истинно реляционной системе над виртуальными таблицами можно выполнять все «теоретически» возможные операции. Большинство современных систем управления реляционными базами данных не удовлетворяют этому правилу полностью.
В реальном мире управления информацией данные часто являются неизвестными или неполными: неизвестен телефонный номер, не захотели указать возраст. Такие пропуски информации создают «дыры» в таблицах. Проблема, конечно, состоит не в простой неприглядности подобных дыр. Опасность состоит в том, что из-за них база данных может стать противоречивой. Чтобы сохранить целостность данных в реляционной модели, так же, как и в правилах Кодда, для обработки пропущенной информации используется понятие нуля.
«Нуль» не означает пустое поле или обычный математический нуль. Он отображает тот факт, что значение неизвестно, недоступно или неприменимо. Существенно, что использование нулей инициирует переход с двухзначной логики (да/нет) на трехзначную (да/нет/может быть). С точки зрения другого эксперта по реляционным системам, Дейта, нули не являются полноценным решением проблемы пропусков информации. Тем не менее они являются составной частью большинства официальных стандартов различных реляционных СУБД.
Целостность - очень сложный и серьезный вопрос при управлении реляционными базами данных. Несогласованность между данными может возникать по целому ряду причин. Несогласованность или противоречивость данных может возникать вследствие сбоя системы - проблемы с аппаратным обеспечением, ошибки в программном обеспечении или логической ошибки в приложениях. Реляционные системы управления базами данных защищают данные от такого типа несогласованности, гарантируя, что команда либо будет исполнена до конца, либо будет полностью отменена. Этот процесс обычно называют управлением транзакциями.
Другой тип целостности, называемый объектной целостностью, связан с корректным проектированием базы данных. Объектная целостность требует, чтобы ни один первичный ключ не имел нулевого значения.
Третий тип целостности, называемой ссылочной целостностью, означает непротиворечивость между частями информации, повторяющимися в разных таблицах. Например, если вы изменяете неправильно введенный номер карточки страхового полиса в одной таблице, другие таблицы, содержащие эту же информацию, продолжают ссылаться на старый номер, поэтому необходимо обновить и эти таблицы. Чрезвычайно важно, чтобы при изменении информации в одном месте, она соответственно изменялась и во всех других местах. Кроме того, по определению Кодда, ограничения на целостность должны:
Определяться на языке высокого уровня, используемом системой для всех других целей;
Храниться в словаре данных, а не в программных приложениях.
Эти возможности в том или ином виде реализованы в большинстве систем.
7. Проектирование баз данных
Процесс, в ходе которого решается, какой вид будет у вновь создаваемой БД, называется проектированием базы данных. На этапе проектирования необходимо предусмотреть все возможные действия , которые могут возникнуть на различных этапах жизненного цикла БД (рис.2).
|
Процедуры, выполняемые на этапах жизненного цикла БД
|
|
|
|
|
|
|
|
|
|
|
|
|
Проектирование
|
|
Создание
|
|
|
|
Эксплуатация
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Анализ предметной области и запросов к БД
|
|
Генерация схемы БД
|
|
Реорганизация БД
|
|
Организация доступа к базам данных
|
|
Контроль состояния БД
|
|
|
|
|
|
|
|
|
|
|
|
Интеграция пользовательских представлений
|
|
Подготовка среды хранения
|
|
Реструктуризация БД
|
|
Поиск и обновление данных
|
|
Сбор и анализ статистики использования БД
|
|
|
|
|
|
|
|
|
|
|
|
Выбор средства реализации
|
|
Ввод и контроль данных
|
|
Реформатизация БД
|
|
Вывод отчетов
|
|
Контроль целостности БД
|
|
|
|
|
|
|
|
|
|
|
|
Логическое проектирование
|
|
Загрузка и корректировка БД
|
|
|
|
Разграничение доступа
|
|
Копирование и восстановление БД
|
|
|
|
|
|
|
|
|
|
|
|
Физическое проектирование
|
|
|
|
|
|
Инициирование и завершение работы с СУБД
|
|
|
|
|
Рис. 2
8. Анализ предметной области и запросов к БД.
На данном этапе необходимо проанализировать запросы пользователей, выбрать информационные объекты и их характеристики и на основе анализа структурировать предметную область (рис. 3).
Анализ предметной области целесообразно разбить на три фазы:
Анализ концептуальных требований и информационных потребностей;
Выявление информационных объектов и связей между ними;
Построение концептуальной модели предметной области и проектирование концептуальной схемы БД
Объекты реального мира
|
|
Ограничения эксплуатации (технология)
|
|
Входные / выходные/ документы
|
|
|
|
Уровень реальности
|
|
Описания объектов предметной области
|
|
|
Внешние пользовательские представления (описание функций приложений - задач)
|
|
|
|
Уровень концептуального проектирования
|
|
Описание предметной области на языке описания данных выбранной СУБД
|
|
Описание входных и выходных форм документов и функций обработки данных на языках описания входных и выходных форм запросов выбранной СУБД
|
|
|
|
Уровень формальных текстов (логическое проектирование)
|
|
|
|
|
|
|
|
|
Описание Уровень физической Библиотека Библиотека
базы реализации входных и запросов
данных вых. форм
Рис. 3
9. Анализ концептуальных требований
На этапе анализа концептуальных требований и информационных потребностей необходимо решить следующие задачи:
Анализ требований пользователей к БД (концептуальных требований);
Выявление имеющихся задач по обработке информации, которая должна быть представлена в БД (анализ приложений);
Выявление перспективных задач (перспективных приложений);
Документирование результатов анализа.
Требования пользователей к разрабатываемой БД представляют собой список запросов с указанием их интенсивности и объемов данных. Эти сведения разработчики получают в диалоге с будущими пользователями БД. Здесь же выясняются требования к вводу, обновлению и корректировке информации. Требования пользователей уточняются и дополняются при анализе имеющихся и перспективных приложений.
Например, в случае разработки БД для ведения электронной документации отдела кадров учебного заведения необходимо получить ответы на вопросы:
Сколько студентов учится в ВУЗе?
Сколько штатных преподавателей и сколько совместителей?
Сколько сформировано учебных групп?
Как распределены учащиеся по группам
Сколько предметов дается по каждой параллели и в каких объемах
Преподаватели: их специализация и классность?
Как часто обновляется информация в БД?
Какие существуют виды отчетов, справок и диаграмм?
Необходимо решить задачи:
Ведения личных дел учащихся
Ведение личных дел преподавателй
Ведения учёта выдачи выписок и справок
На основе информации хранящейся в БД необходимо выдавать следующие отчеты:
Личные данные преподавателя (фамилия, имя, отчество, дата рождения, место рождения, образование, паспортные данные, прописка, данные диплома, тарификационный разряд, сведения об ученых степенях, сведения о дополнительных образованиях), какие курсы ведет, нагрузка.
Личные данные студента (фамилия, имя, отчество, дата рождения, место рождения, образование, паспортные данные, прописка, данные аттестата, факультет, группа, специализация, научный руководитель.
Статистические данные по учащимся
Статистические данные по преподавателям
Отчет по предмету
Список выбывших учащихся
Движение за год
10. Выявление информационных объектов и связей между ними
Вторая фаза анализа предметной области состоит в выборе информационных объектов, задании необходимых свойств для каждого объекта, выявлении связей между объектами, определении ограничений, накладываемых на информационные объекты, типы связей между ним, характеристики информационных объектов.
При выборе информационных объектов необходимо ответить на ряд вопросов:
На какие таблицы можно разбить данные, подлежащие хранению в БД?
Какое имя можно присвоить каждой таблице?
Какие наиболее интересные характеристики (с точки зрения пользователя) можно выделить?
Какие имена можно присвоить выбранным характеристикам?
В нашем случае предполагается завести следующие таблицы (рис 4):
ВУЗ
|
Факультет
|
Предметы
|
Ученики
|
Учителя
|
|
Наименование
|
Специальность
|
Предмет
|
Группа
|
Фамилия
|
|
Телефон
|
Уч. группа
|
|
Фамилия
|
Имя Отчест
|
|
ректор
|
|
|
Имя
|
Предмет
|
|
|
|
|
Отчество
|
Классность
|
|
|
|
|
|
Разряд
|
|
|
|
|
|
Уч. степень
|
|
|
Рис. 4
Выделим связи между информационными объектами (рис.5)
Рис. 5
В ходе этого процесса необходимо ответить на следующие вопросы:
Какие типы связей между информационными объектами?
Какое имя можно присвоить каждому типу связей?
Каковы возможные типы связей, которые могут быть использованы впоследствии?
Попытка задать ограничения на объекты, их характеристики и связи приводит к необходимости ответа на следующие вопросы:
Какова область значений для числовых характеристик?
Каковы функциональные зависимости между характеристиками одного информационного объекта?
Какой тип отображения соответствует каждому типу связей?
При проектировании БД существуют взаимосвязи между информационными объектами трех типов: «один к одному», «один ко многим», «многие ко многим» (рис.6).
Например:
Ученик
|
Один к одному
|
Личное дело
|
|
|
|
|
|
Группа
|
Один ко многим
|
Ученик
|
|
|
|
|
|
Ученик
|
Многие к многим
|
Преподаватель
|
|
|
Рис. 6
11. Построение концептуальной модели
В простых случаях для построения концептуальной схемы используют традиционные методы агрегации и обобщения. При агрегации объединяются информационные объекты (элементы данных) в один в соответствии с семантическими связями между объектами.
Выбор модели диктуется прежде всего характером предметной области и требованиями к БД. Другим немаловажным обстоятельством является независимость концептуальной модели от СУБД, которая должна быть выбрана после построения концептуальной схемы.
Модели «сущность-связь», дающие возможность представлять структуру и ограничения реального мира, а затем трансформировать их в соответствии с возможностями промышленных СУБД, являются весьма распространенными.
Под сущностью понимают основное содержание того явления, процесса или объекта, о котором собирают информацию для БД. В качестве сущности могут выступать место, вещь, личность, явление и т.д. При этом различают тип сущности и экземпляр сущности. Под типом сущности обычно понимают набор однородных объектов, выступающих как целое. Понятие «экземпляр сущности» относится к конкретному предмету. Например:
Тип сущности - ученик
Экземпляр сущности - Иванов, Петров, Сидоров и др.
В нашем примере Школа, Класс, Предметы, Ученики, Учителя, Оценки - сущности. Проанализируем связи между сущностями (рис.7).
Название связи
|
Между сущностями
|
|
Учится
|
Ученик
|
Группа
|
|
Изучает
|
Ученик
|
Предмет
|
|
Имеет
|
ВУЗ
|
Группа
|
|
Преподает
|
Учитель
|
Предмет
|
|
Работает
|
Учитель
|
предмет
|
|
|
Рис. 7
Теперь можно перейти к проектированию информационной (концептуальной) схемы БД (атрибуты сущностей на диаграмме не показаны) (рис.8).
принадлежит
|
|
ВУЗ
|
|
|
|
|
|
|
|
|
|
Группа
|
|
Учится
|
|
Ученик
|
|
|
|
|
|
|
|
работает
|
|
|
|
изучает
|
|
|
|
|
|
|
|
Учитель
|
|
Преподает
|
|
Предмет
|
|
|
|
|
|
|
|
|
|
|
экзамен
|
|
|
|
|
|
|
|
|
|
|
|
Ведомость
|
|
|
|
Рис. 9
12. Логическое проектирование
Логическое проектирование представляет собой необходимый этап при создании БД. Основной задачей логического проектирования является разработка логической схемы, ориентированной на выбранную систему управления базами данных. Процесс логического проектирования состоит из следующих этапов:
Выбор конкретной СУБД;
Отображение концептуальной схемы на логическую схему;
Выбор языка манипулирования данными.
13. Выбор конкретной СУБД
Одним из основных критериев выбора СУБД является оценка того , насколько эффективно внутренняя модель данных, поддерживаемая системой, способна описать концептуальную схему. Системы управления базами данных, ориентированные на персональные компьютеры, как правило поддерживают реляционную или сетевую модель данных. Подавляющее большинство современных СУБД - реляционные.
Конструирование баз данных на основе реляционной модели имеет ряд важных преимуществ перед другими моделями
Независимость логической структуры от физического и пользовательского представления.
Гибкость структуры базы данных - конструктивные решения не ограничивают возможности разработчика БД выполнять в будущем самые разнообразные запросы.
Так как реляционная модель не требует описания всех возможных связей между данными, впоследствии разработчик может задавать запросы о любых логических взаимосвязях, содержащихся в базе, а не только о тех, которые планировались первоначально.
14. Выбор языка манипулирования данными
Важной составной частью СУБД является язык манипулирования данными, который используется при работе различных приложений с БД. Как правило, язык манипулирования данными встраивается в язык программирования. Кроме того, при выборе СУБД, реализующей конкретную БД, необходимо оценить и техническую сторону дела, которая непосредственно связана с производительностью системы. В целом необходимо оценить семь групп параметров для выбора СУБД:
Характеристики ПК: тип, модель, фирма производитель, наличие гарантии.
Управление файлами и поиск: тип связи, модификация нескольких файлов, двунаправленное соединение таблиц, язык манипулирования данными, тип поиска.
Средства поддержки приложений: каталог данных, генератор приложений, процедурный язык, подпрограммы, макросы, отладчик, система поддержки исполнения, шифровка программ и данных, разграничения доступа, графика, текстовый редактор, статистика.
Ввод и поддержка целостности: управление с помощью команд, управление с помощью меню, проверка целостности по таблице, проверка уникальности ключа, проверка по дате, независимость данных.
Отчеты: отчеты по нескольким файлам, сохранение форматов отчетов, выдача отчета на экран, выдача отчета на магнитный носитель, вычисляемые поля, группы, переопределение формата даты, заголовки отчетов, генератор отчетов, итоговые поля, максимальная ширина отчета.
Операционная среда: тип операционной системы, объем требуемой оперативной памяти, необходимость использования постоянной памяти, объем требуемой постоянной памяти, язык подсистемы.
Дополнительные сведения: наличие сетевого варианта, стоимость, примечание, источники.
В нашей ситуации мы имеем локальную сеть из 8 машин (P-II -433), ориентированных на работу с бухгалтерией и отделом кадров с выделенным сервером (сеть второго уровня) на основе Windows NT 4.0 , база данных выполнена на основе Access 2000, т.е. это реляционная база данных. Реализация базы данных с использованием этого программного обеспечения позволяет обходиться без решения специальных задач, выполняя всю работу фактически в рамках работы с электронным офисом.
Microsoft Access спроектирован таким образом, что он может быть использован как в качестве самостоятельной СУБД на отдельной рабочей станции, так и в сети - в режиме «клиент-сервер». Поскольку в Microsoft Access к данным могут иметь доступ одновременно несколько пользователей, в нем предусмотрены надежные средства защиты и обеспечения целостности данных. Можно заранее указать, какие пользователи или группы пользователей могут иметь доступ к объектам (таблицам, формам, запросам) базы данных. Microsoft Access автоматически обеспечивает защиту данных от одновременной их корректировки разными пользователями. Access также опознает и учитывает защитные средства других подсоединенных к базе данных структур (таких, как базы данных Paradox, dBASE и SQL).
Практически все существующие СУБД имеют средства разработки приложений, которые могут использованы программистами или квалифицированными пользователями при создании процедур для автоматизации управления и обработки данных.
Microsoft Access предоставляет дополнительные средства разработки приложений, которые могут работать не только с собственными форматами данных, но и с форматами других наиболее распространенных СУБД. Возможно, наиболее сильной стороной Access является его способность обрабатывать данные электронных таблиц, текстовых файлов, файлов dBASE, Paradox, Btrieve, FoxPro и любой другой базы данных SQL, поддерживающей стандарт ODBE. Это означает, что можно использовать Access для создания такого приложения Windows, которое может обрабатывать данные, поступающие с сетевого сервера SQL или базы данных SQL на главной ЭВМ.
Архивирование данных проводится автоматически средствами Windows NT Server, при этом сама архитектура NT позволяет не заботиться об учёте и локализации сбойных секторов дисковой системы сервера. Для полной безопасности данных предусмотрено архивное копирование данных с использованием ZIP-Drive 100 Mb. Как наиболее дешевого средства вторичного копирования.
Архитектура Windows NT хорошо адаптирована к различным сбойным ситуациям, устойчива к поражению вирусами. В случае отказа в работе операционной системы на одной или нескольких локальных станциях сохраняется целостность данных на сервере и последняя временная копия базы. В случае общего сбоя в системе (полное отключение энергопитания, замыкание и т.п.) вернуться к работе с сохраненными документами и фрагментами базы можно после восстановительных мероприятий, проводимых системным администратором по восстановлению целостности файловой системы в сети. Обычно на это уходит 2-3 часа. При этом также, если не были повреждены жесткие диски сервера, сохраняются последняя сохраненная копия документа (базы данных) и последний временно сохраненный фрагмент.
С точки зрения предотвращения несанкционированного доступа к информации, хранящейся на сервере или на одной из локальных рабочих станций, Windows NT 4. предусматривает практически полную технологическую безопасность. А именно, невозможно получить доступ к определенным типам файлов без соответствующего допуска, заключающегося в выдаче пароля и разрешению доступа к данным файлам с этим паролем, что входит в обязанности системного администратора. В любом случае администратор может отслеживать доступ к данному файлу и точно указать время, номер машины и пароль, с которыми был совершен доступ к файлу.
СПИСОК ЛИТЕРАТУРЫ.
Дейт К. Введение в системы баз данных. - М.: Наука, 1980. - 464 с.
Дунаев С. Borland - технологии. - М.: Диалог-Мифи, 1999. - 288 с.
Компьютерные технологии обработки информации. / Под ред. С.В. Назарова. - М.: Финансы и статистика, 1998. - 247 с.
Куправа Т.А. Создание и программирование баз данных средствами СУБД dBase III Plus, FoxBASE Plus, Clipper. - М.: Мир, 1991. - 110 с.
Мартин Г. SQL: Справочное руководство. - М.: Лори, 2000. - 291 с.
Мартин Дж. Организация данных в вычислительных системах. - М.: Мир, 1978. - 662 с.
Орлов В.Н., Лаптев В.С. Модели данных в СУБД / Под ред. В.И. Першикова. - М.: МО СССР, 1982. - 124 с.
Системы управления базами данных и знаний: Справочное издание / А.Н. Наумов, А.М. Вендров, В.К. Иванов и др.; Под ред. А.Н. Наумова. - М.: Финансы и статистика, 1997. - 352 с.
Ульман Дж. Основы систем баз данных. - М.: Финансы и статистика, 1983. - 334 с.
Четвериков В.Н., Ревунков Г.И., Самохвалов Э.Н. Базы и бланки данных. - М.: Высшая школа, 1998. - 248 с.
|