Информационный процесс накопления данных. Генетические алгоритмы

12.04.2019

Назначение технологического процесса накопления данных состоит в создании, хранении и поддержании в актуальном состоянии информационного фонда, необходимого для выполнения функциональных задач системы управления, для которой построен контур информационной технологии. Кроме того, хранимые данные по запросу пользователя или программы должны быть быстро (особенно для систем реального времени) и в достаточном объеме извлечены из области хранения и переведены в оперативные запоминающие устройства ЭВМ для последующего либо преобразования по заданным алгоритмам, либо отображения, либо передачи.

Указанные функции, выполняемые в процессе накопления данных, реализуются по алгоритмам, разработанным на основе соответствующих математических моделей.

Процессы и операции, выполняемые при протекании процесса накопления данных, приведены на структурной схеме рис. 4.1.

Рис.4.1 Состав процедур процесса накопления данных.

Информационный фонд систем управления должен формироваться на основе принципов необходимой полноты и минимальной избыточности хранимой информации. Эти принципы реализуются процедурой выбора хранимых данных , в процессе выполнения которой производится анализ циркулирующих в системе данных и на основе их группировки на входные, промежуточные и выходные, определяется состав хранимых данных. Входные данные - это данные, получаемые из первичной информации и создающие информационный образ предметной области. Они подлежат хранению в первую очередь. Промежуточные данные - это данные, формирующиеся из других данных при алгоритмических преобразованиях. Как правило, они не хранятся, но накладывают ограничения на емкость оперативной памяти компьютера.

Выходные данные являются результатом обработки первичных (входных) данных по соответствующей модели и входят в состав управляющего информационного потока своего уровня и подлежат хранению в определенном временном интервале. Вообще, данные имеют свой жизненный цикл существования, который фактически и отображается в процедурах процесса накопления. Структурная схема жизненного цикла данных приведена на рис. 4.2.

Рис. 4.2 Структурная схема жизненного цикла существования данных.

Из этой схемы следует, что процедуры хранения, актуализации и извлечения данных должны периодически сопровождаться оценкой необходимости их хранения, так как данные подвержены старению. Устаревшие данные должны быть удалены.

Процедура хранения состоит в том, чтобы сформировать и поддерживать структуру хранения данных в памяти ЭВМ. Современные структуры хранения данных должны быть независимы от программ, использующих эти данные и реализовывать вышеуказанные принципы (полнота и минимальная избыточность). Такие структуры получили название баз данных (БД). Осуществление процедур создания структуры хранения (базы данных), актуализация, извлечение и удаление данных производится с помощью специальных программ, называемых системами управления базами данных (СУБД).

Процедура актуализации данных позволяет изменить значения данных, записанных в базе, либо дополнить определенный раздел, группу данных. Устаревшие данные могут быть удалены с помощью соответствующей операции.

Процедура извлечения данных необходима для пересылки из базы данных требующихся данных либо для преобразования, либо для отображения, либо для передачи по вычислительной сети.

При выполнении процедур актуализации и извлечения обязательно выполняются операции поиска данных по заданным признакам и их сортировки , состоящие в изменении порядка расположения данных при хранении или извлечении.

На логическом уровне все процедуры процесса накопления должны быть формализованы, что отображается в математических и алгоритмических моделях этих процедур.

ВЫБОР ХРАНИМЫХ ДАННЫХ

Информационный фонд системы управления должен обеспечивать получение выходных наборов данных из входных с помощью алгоритмов обработки и корректировки данных. Это возможно, если создана инфологическая модель предметной области, которая вместе с наборами хранимых данных и алгоритмами их обработки позволяет построить каноническую модель (схему) информационной базы, а затем перейти к логической схеме и, далее, к физическому уровню реализации.

Инфологической (концептуальной) моделью предметной области называют описание предметной области без ориентации на используемые в дальнейшем программные и технические средства. Однако, для построения информационной базы инфологической модели не достаточно. Необходимо провести анализ информационных потоков в системе с целью установления связи между элементами данных, их группировки в наборы входных, промежуточных и выходных элементов данных, исключения избыточных связей и элементов данных. Получаемая в результате такого анализа безызбыточная структура носит название канонической структуры информационной базы и является одной из форм представления инфологической модели предметной области.

Для анализа информационных потоков в управляемой системе исходными являются данные о парных взаимосвязях, или отношениях (т.е. есть отношение или нет отношения) между наборами информационных элементов. Под информационными элементами понимают различные типы входных, промежуточных и выходных данных, которые составляют наборы входных N 1 , промежуточных N 2 и выходных N 3 элементов данных.

Формализовано связи (парные отношения) между наборами информационных элементов отображаются в виде матрицы смежности B, под которой понимают квадратную бинарную матрицу, проиндексированную по обеим осям множеством информационных элементов

где s - число этих элементов.

где q i j =

В позиции (i,j ) матрицы смежности записывают „1“(т.е.q i j =1), если между информационными элементами и существует отношение R 0 , такое, что для получения значения информационного элемента необходимо непосредственное обращение к элементу . Наличие такого отношения между и обозначают в виде , чему соответствует q ij =1, а отсутствие - и запись „0“ в позиции (), т.е. . Для простоты принимают, что каждый информационный элемент недостижим из самого себя:

Матрице B ставится в соответствие информационный граф . Множеством вершин графа является множество D информационных элементов, а каждая дуга (d i , d j ) соответствует условию ; т.е. записи „1“ в позиции () матрицы B .

Например, задано множество D из четырех наборов информационных элементов, т.е. . Пусть матрица смежности B этих элементов

имеет вид: .

Из этой матрицы видно, что для вычисления элемента необходимо обращение к элементам и , а для получения элемента - к элементу . Чтобы получить элемент , надо обратиться к . Элемент не зависит от других элементов матрицы. Информационный граф в этом простейшем случае будет соответствовать рис. 4.3.

Рис.4.3 Информационный граф

В общем случае структура графа вследствие неупорядоченности сложна для восприятия и анализа. Составленная на основе инфологической модели, она не гарантирована от неточностей, ошибок, избыточности и транзитивности. Для формального выделения входных, промежуточных и выходных наборов информационных элементов, определения последовательности операций их обработки, анализа и уточнения взаимосвязей на основе графа строят матрицу достижимости .

Матрицей достижимости M называют квадратную бинарную матрицу, проиндексированную по обеим осям множеством информационных элементов D , аналогично матрице смежности B . Запись „1“ в каждой позиции (ij ) матрицы достижимости соответствует наличию для упорядоченной пары информационных элементов (), смыслового отношения достижимости R . Элемент достижим из элемента , т.е. выполняется условие , если на графе существует направленный путь от вершины к вершине (в процессе получения значения элемента используется значение элемента ). Если , то отношение достижимости между элементами и отсутствует и в позиции (ij ) матрицы M записывают „0“. Отношение достижимости транзитивно, т.е. если и , то ; .

Записи „1“ в j- м столбце матрицы M соответствуют информационным элементам , которые необходимы для получения значений элементов , и которые образуют множество элементов предшествования A () для этого элемента. Записи „1“ в i- ой строке матрицы M соответствуют всем элементам , достижимым из рассматриваемого элемента и образующим множество достижимости R () этого элемента. Информационные элементы, строки которых в матрице M не содержат единиц (нулевые строки), являются выходными информационными элементами, а информационные элементы, соответствующие нулевым столбцам матрицы M , являются входными . Это условие может служить проверкой правильности заполнения матриц B и M , если наборы входных и выходных информационных элементов известны. Информационные элементы, не имеющие нулевой строки или столбца, являются промежуточными .

Для полученного в примере графа (рис. 4.3) матрица M будет выглядеть так:

Отличие столбцов матриц M и B объясняется тем, что в матрице M учитывается смысловое отношение между информационными элементами, а в матрице B только непосредственное . Например, элемент в матрице M достижим из элементов, , и , т.е. , и , в то время как в матрице B для этих элементов достижим только из , т.е. только , а и . Из анализа матрицы M следует, что элемент является входным, - выходным, остальные - промежуточные. На основе матрицы M строится информационный граф системы, структурированный по входным (), промежуточным () и выходным () наборам информационных элементов, и полученный из анализа множеств элементов предшествования A () и достижимости R (). Граф , полученный из матрицы M рассматриваемого примера, приведен на рисунке 4.4.

Рис.4.4 Информационный граф

В общем случае информационный граф системы, в отличие от вычисленного графа, может иметь контуры и петли, что объясняется необходимостью повторного обращения к отдельным элементам данных.

Информационный граф системы структурируется по уровням ( , , ) с использованием итерационной процедуры, что позволяет определить информационные входы и выходы системы, выделить основные этапы обработки данных, их последовательность и циклы обработки на каждом уровне. Кроме того, удаляются избыточные (лишние) дуги и элементы. Граф, получаемый после структуризации по наборам информационных элементов и удаления избыточных элементов и связей, определяет каноническую структуру информационной базы. Таким образом, каноническая структура задает логически неизбыточную информационную базу. Выделение наборов элементов данных по уровням позволяет объединить множество значений конечных элементов в логические записи и тем самым упорядочить их в памяти ЭВМ.

От канонической структуры переходят к логической структуре информационной базы, а затем - к физической организации информационных массивов. Каноническая структура является также основой для автоматизации основных процессов предпроектного анализа предметных областей систем управления.

Процедуры хранения, актуализации и извлечения данных непосредственно связаны с базами данных, поэтому логический уровень этих процедур определяется моделями баз данных.

БАЗЫ ДАННЫХ

База данных определяется как совокупность взаимосвязанных данных, характеризующихся: возможностью использования для большого количества приложений; возможностью быстрого получения и модификации необходимой информации; минимальной избыточностью информации; независимостью от прикладных программ; общим управляемым способом поиска .

Возможность использования баз данных для многих прикладных программ пользователя упрощает реализацию комплексных запросов, снижает избыточность хранимых данных и повышает эффективность использования информационной технологии. Минимальная избыточность и возможность быстрой модификации позволяет поддерживать данные на одинаковом уровне актуальности. Независимость данных и использующих их программ является основным свойством баз данных. Независимость данных подразумевает, что изменение данных не приводит к изменению прикладных программ и наоборот.

Модели баз данных базируются на современном подходе к обработке информации, состоящем в том, что структуры данных обладают относительной устойчивостью. Действительно, типы объектов предприятия, для управления которым создается информационная технология, если и изменяются во времени, то достаточно редко, а это приводит к тому, что и структура данных, обрабатываемых эти объекты, достаточно стабильна. Поэтому возможно построение информационной базы с постоянной структурой и изменяемыми значениями данных. Каноническая структура информационной базы, отображающая в структурированном виде информационную модель предметной области, позволяет сформировать логические записи, их элементы и взаимосвязи между ними. Взаимосвязи могут быть типизированы по следующим основным видам: „один к одному“, когда одна запись может быть связана только с одной записью; „один ко многим“, когда одна запись взаимосвязана со многими другими; „многие ко многим“, когда одна и та же запись может входить в отношения со многими другими записями в различных вариантах. Применение того или иного вида взаимосвязей определило три основных модели баз данных: иерархической, сетевой реляционной.

Для пояснения логической структуры основных моделей баз данных рассмотрим такую простую задачу: необходимо разработать логическую структуру БД для хранения данных о трех поставщиках П 1 , П 2 и П 3 , которые могут поставлять товары Т 1 ,Т 2 и Т 3 в следующих комбинациях: поставщик П 1 - все три вида товаров, поставщик П 2 - товары Т 1 и Т 3 , поставщик П 3 - товары Т 2 и Т 3 .

Сначала построим логическую модель БД, основанную на иерархическом подходе. Иерархическая модель представляется в виде древовидного графа, в котором объекты выделяются по уровням соподчиненности (иерархии) объектов (рис. 4.5).

Рис.4.5 Иерархическая модель БД

На верхнем первом уровне находится информация об объекте „поставщики“ (П), на втором - о конкретных поставщиках П 1 , П 2 и П 3 , на нижнем третьем уровне - о товарах, которые могут поставлять конкретные поставщики. В иерархической модели должно соблюдаться правило: каждый порожденный узел не может иметь больше одного порождающего узла (только одна входящая стрелка); в структуре может быть только один не порожденный узел (без входящей стрелки) - корень. Узлы, не имеющие входных стрелок, носят название листьев. Узел интегрируется как запись. Для поиска необходимой записи нужно двигаться от корня к листьям, т.е. сверху вниз, что значительно упрощает доступ. Иерархическая модель данных позволяет описать их структуру как на логическом, так и на физическом уровнях. Однако, из-за жесткой фиксированности взаимосвязей между элементами данных, любые изменения связей требуют изменение структуры. Принципиальным недостатком иерархической структуры является также жесткая зависимость физической и логической организации данных. Быстрота доступа в иерархической модели достигнута за счет потери информационной гибкости (за один проход по дереву невозможно, например, получить информацию о том, какие поставщики поставляют, скажем, товар Т1). Указанные недостатки ограничивают применение иерархической структуры.

В иерархической модели используется вид связи между элементами данных „один ко многим“. Если применяется взаимосвязь вида „многие ко многим“, то приходят к сетевой модели данных.

Сетевая модель базы данных для поставленной задачи представлена в виде диаграммы связей на рис.4.6.

На диаграмме указаны независимые (основные) типы данных П 1 , П 2 и П 3 , т.е. информация о поставщиках, и зависимые - информация о товарах Т 1 , Т 2 и Т 3 . В сетевой модели допустимы любые виды связей между записями и отсутствует ограничение на число обратных связей. Но должно соблюдаться одно правило: связь включает основную и зависимую запись.

Рис.4.6 Сетевая модель БД

Сетевая модель БД, хотя и обладает большей информационной гибкостью, но, как и иерархическая, является достаточно жесткой структурой, что препятствует развитию информационной базы системы управления. При необходимости частой реорганизации информационной базы (например, при использовании настраиваемых базовых информационных технологий) применяют наиболее совершенную модель БД - реляционную, в которой отсутствуют различная между объектами и взаимосвязями.

В реляционной модели базы данных взаимосвязи между элементами данных представляются в виде двумерных таблиц, называемых отношениями . Отношения обладают следующими свойствами: каждый элемент таблицы представляет собой один элемент данных (повторяющиеся группы отсутствуют); элементы столбца имеют одинаковую природу, и столбцам однозначно присвоены имена; в таблице нет двух одинаковых строк; строки и столбцы могут просматриваться в любом порядке вне зависимости от их информационного содержания. Реляционная модель БД обладает следующими преимуществами: простотой логической модели (таблицы привычны для представления информации); гибкостью системы защиты (для каждого отношения может быть задана правомерность доступа); независимостью данных; возможностью построения простого языка манипулирования данными с помощью математически строгой теории реляционной алгебры (алгебры отношений). Собственно, наличие строгого математического аппарата для реляционной модели баз данных и обусловило её наибольшее распространение и перспективность в современных информационных технологиях.

Для приведенной выше задачи о поставщиках и товарах, логическая структура реляционной БД будет содержать три таблицы (отношения): R 1 и R 2 , состоящие из записей о поставщиках и о товарах соответственно, и R 3 - о поставках товаров поставщиками (рис. 4.7).

Учитывая широкое применение реляционных моделей баз данных в информационных технологиях (особенно экономических), дадим более подробное описание этой структуры.

Рис 4.7 Реляционная модель БД

Технологии хранения и поиска информации

Информатизация современного общества неразрывно связана со сбором, накоплением, обработкой, хранением, передачей и использованием информации, с использованием современных средств вычислительной техники и информационного обмена. Эти процессы можно назвать доминирующим видом деятельности в сфере общественного производства. Для систематизации и хранения бумажных документов применяют разнообразные средства оргтехники. Для хранения электронных документов используют различные носители (магнитные, магнитооптические, оптические диски и др.). В последнее время широко развивается концепция информационных хранилищ, представляющих собой программно-аппаратные комплексы для придания единого общего вида всей совокупности данных, порождаемых в рамках организации. Производство информации направлено на целесообразное использование информационных ресурсов и снабжение ими всех элементов организационной структуры. Реализуется производство информации путем создания информационной системы.

Обработка данных об объектах реального мира является целью любой информационной системы. В широком смысле база данных - это сведения о конкретных объектах какой-либо предметной области. Под предметной областью понимают часть реального мира, подлежащего изучению для организации управления и, в конечном счете, автоматизации . Создавая базу данных, пользователь упорядочивает информацию по различным признакам. В дальнейшем эту информацию можно быстро извлекать, формируя выборки с произвольным сочетанием признаков. Это возможно если данные структурированы.

Электронные картотеки на материальных носителях, в которых данные хранятся в структурированном виде для удобного использования различными пользователями и программами называют базами данных.

Назначение технологического процесса накопления данных состоит в создании, хранении и поддержании в актуальном состоянии информационного фонда, необходимого для выполнения функциональных задач системы управления. Данные имеют свой жизненный цикл существования, который фактически и отображается в процедурах процесса накопления. Хранение и накопление являются одними из основных действий, осуществляемых над информацией и главным средством обеспечения ее доступности в течение некоторого промежутка времени. Хранимые данные по запросу пользователя или программы должны быть быстро (особенно для систем реального времени) и в достаточном объеме извлечены из области хранения и переведены в оперативные запоминающие устройства ЭВМ для дальнейшего преобразования, отображения или передачи.

К основным процедурам процесса накопления данных помимо хранения относятся также выбор хранимых данных, их актуализация и извлечение. Процедуры хранения, актуализации и извлечения данных должны периодически сопровождаться оценкой необходимости их хранения, поскольку устаревшие данные должны своевременно удаляться.

Информационный фонд систем управления должен формироваться на основе принципов необходимой полноты и минимальной избыточности хранимой информации. Эти принципы реализуются процедурой выбора хранимых данных, когда производится анализ циркулирующих в системе данных и на основе их группировки на входные, промежуточные и выходные определяется состав хранимых данных. Входные данные - это данные, получаемые из первичной информации и создающие информационный образ предметной области. Входные данные в первую очередь подлежат хранению. Промежуточные данные - это данные, формирующиеся из других данных при алгоритмических преобразованиях. Как правило, они не хранятся, но накладывают ограничения на емкость оперативной памяти компьютера. Выходные данные являются результатом обработки первичных (входных) данных по соответствующей модели, они входят в состав управляющего информационного потока своего уровня и подлежат хранению в определенном временном интервале.

В настоящее время определяющим направлением реализации основных процедур процесса накопления данных является концепция базы данных (БД),склада или хранилища данных. Осуществление процедур создания структуры хранения (базы данных), актуализации, извлечения и удаления данных производится с помощью специальных программ, называемых системами управления базами данных (СУБД). Основная цель процедуры хранения состоит в формировании и поддержании структуры хранения данных в памяти ЭВМ. Структуры хранения данных помимо обеспечения реализации принципов полноты и минимальной избыточности должны быть независимы от программ, использующих эти данные.

Процедура актуализации данных позволяет изменить значения данных, записанных в базе, дополнить определенный раздел, группу данных, удалить устаревшие данные с помощью соответствующей операции. Процедура извлечения данных необходима для пересылки из базы данных требуемых данных или для их преобразования, отображения, или передачи по вычислительной сети. При выполнении процедур актуализации и извлечения обязательно выполняются операции поиска данных по заданным признакам и, при необходимости, сортировки данных, заключающиеся в изменении порядка расположения данных при хранении или извлечении.

Для представления информации о явлениях или объектах части реального мира при помощи структурных взаимосвязей между совокупностями данных может быть использована структурная модель данных.Таким образом, база данных представляет собой совокупность взаимосвязанных данных, предназначенных для коллективного и многократного использования и характеризующихся возможностью быстрого получения и модификации необходимой информации, минимальной избыточностью информации, независимостью от программ пользователя, общим управляемым способом поиска.

Банк данных(БнД) – система, представляющая определенные услуги по хранению и поиску данных определенной группе пользователей по определенной тематике. База данных является информационной составляющей БнД.

Система баз данных – совокупность управляющей системы, прикладного программного обеспечения, базы данных, операционной системы и технических средств, обеспечивающих информационное обслуживание пользователей.

Хранилище данных (ХД) (применяются также термины «склад данных», «информационное хранилище») – предметно-ориентированная, интегрированная автоматизированная система, хранящая данные, агрегированные по многим измерениям и предназначенная для поддержки принятия управленческих решений . Основные отличия ХД от БД следующие: агрегирование данных, из ХД данные никогда не удаляются, пополнение ХД происходит периодически, формирование новых агрегатов данных, зависящих от старых, автоматическое. Технология хранилища данных обеспечивает сбор данных из внутренних БД предприятия и внешних источников, формирование, хранение и эксплуатацию информации как единой, хранение аналитических данных в удобной для анализа и принятия управленческих решений форме.

В настоящее время альтернативу ХД составляет концепция витрин данных – множество тематических БД, содержащих информацию, относящуюся к отдельным информационным аспектам предметной области. Витрины данных рассматривают и как один из видов хранилища данных, так как при их построении используются основные принципы построения хранилищ данных. Витрины данных строятся без создания центрального хранилища, информация поступает из локальных БД и ограничена конкретной предметной областью, поэтому в разных витринах данных информация может дублироваться. Например, витрины данных с информацией о сотрудниках предприятия и данных о финансовых операциях того же предприятия содержат данные о заработной плате сотрудников.

Хранение и накопление относятся к числу основных действий, осуществляемых над информацией, и главным средством обеспечения ее доступности в течение некоторого промежутка времени. В настоящее время определяющим направлением реализации этой операции является концепция базы данных, их склада (хранилища).

База данных (БД) может быть определена как совокупность взаимосвязанных данных, используемых несколькими пользователями и хранящихся с регулируемой избыточностью. Хранимые данные не зависят от программ пользователей, для модификации и внесения изменений применяется общий управляющий метод.

Банк данных - система, представляющая определенные услуги по хранению и поиску данных для определенной группы пользователей по определенной тематике.

Система управления базой данных (СУБД) - совокупность управляющей системы, прикладного программного обеспечения, БД, операционной системы и технических средств, обеспечивающих информационное обслуживание пользователей.

Хранилище данных (ХД, используют также термины Data Warehouse, «склад данных», «информационное хранилище») - это база, хранящая данные, агрегированные по многим измерениям. Основные отличия ХД от БД:

агрегирование данных;
данные из ХД никогда не удаляются;
пополнение ХД происходит на периодической основе;
формирование новых агрегатов данных, зависящих от старых, автоматическое;
доступ к ХД может осуществляться на основе многомерного куба или гиперкуба.

Альтернативой хранилищу данных является концепция витрин данных (Data Mart).

Витрины данных - это множество тематических БД, содержащих информацию, относящуюся к отдельным информационным аспектам предметной области.

Еще одним важным направлением развития БД являются репозитарии. Репозитарий в упрощенном виде можно рассматривать просто как

БД, предназначенную для хранения не пользовательских, а системных данных. Технология репозитариев проистекает из словарей данных, которые по мере обогащения новыми функциями и возможностями приобретали черты инструмента для управления метаданными.

По отношению к пользователям применяют трехуровневое представление для описания предметной области: концептуальное, логическое и внутреннее (физическое).

Концептуальный уровень связан с частным представлением данных группы пользователей в виде внешней схемы, объединяемых общностью используемой информации. Каждый конкретный пользователь работает с частью БД и представляет ее в виде внешней модели. Этот уровень характеризуется разнообразием используемых моделей (модель «сущность-связь», ER-модель, модель Чена, бинарные и инфоло- гические модели, семантические сети).

Логический уровень является обобщенным представлением данных всех пользователей в абстрактной форме. Используются три вида моделей: иерархические, сетевые и реляционные.

Сетевая модель является моделью объектов-связей, допускающей только бинарные связи «многие к одному», и использует для описания модель ориентированных графов.

Иерархическая модель является разновидностью сетевой, являющейся совокупностью деревьев (лесом).

Реляционная модель использует представление данных в виде таблиц (реляций), в ее основе лежит математическое понятие теоретикомножественного отношения, она базируется на реляционной алгебре и на теории отношений.

Физический (внутренний) уровень связан со способом фактического хранения данных в физической памяти ЭВМ. Во многом он определяется конкретным методом управления. Основными компонентами физического уровня являются хранимые записи, объединяемые в блоки; указатели, необходимые для поиска данных; данные переполнения; промежутки между блоками; служебная информация.

По наиболее характерным признакам БД можно классифицировать следующим образом:

- по способу хранения информации:
- интегрированные;
- распределенные;
- по типу пользователя:
монопользовательские;
многопользовательские;
- по характеру использования данных:
прикладные;
предметные.

В настоящее время при проектировании БД используют два подхода. Первый из них основан на стабильности данных, что обеспечивает наибольшую гибкость и адаптируемость к используемым приложениям. Применение такого подхода целесообразно в тех случаях, когда не предъявляются жесткие требования к эффективности функционирования (объему памяти и продолжительности поиска), существует большое число разнообразных задач с изменяемыми и непредсказуемыми запросами.

Второй подход базируется на стабильности процедур запросов к БД и является предпочтительным при жестких требованиях к эффективности функционирования, особенно это касается быстродействия.

Другим важным аспектом проектирования БД является проблема интеграции и распределения данных. Господствовавшая до недавнего времени концепция интеграции данных при резком увеличении их объема, оказалась несостоятельной. Этот факт, а также увеличение объемов памяти внешних запоминающих устройств при их удешевлении, широкое внедрение сетей передачи данных способствовали внедрению распределенных БД. Распределение данных по месту их использования может осуществляться различными способами.

1. Копируемые данные. Одинаковые копии данных хранятся в различных местах использования, так как это дешевле передачи данных. Модификация данных контролируется централизованно.
2. Подмножества данных. Группы данных, совместимые с исходной БД, хранятся отдельно для местной обработки.
3. Реорганизованные данные. Данные в системе интегрируются при передаче на более высокий уровень.
4. Секционированные данные. На различных объектах используются одинаковые структуры, но хранятся разные данные.
5. Данные с отдельной подсхемой. На различных объектах используются различные структуры данных, объединяемые в интегрированную систему.
6. Несовместимые данные. Независимые БД, спроектированные без координации, требующие объединения.

Важное влияние на процесс создания БД оказывает внутреннее содержание информации. Существует два направления в этом аспекте:

прикладные БД, ориентированные на конкретные приложения, например, может быть создана БД для учета и контроля поступления материалов;
предметные БД, ориентированные на конкретный класс данных, например, предметная БД «Материалы», которая может быть использована для различных приложений.

Конкретная реализация системы БД, с одной стороны, определяется спецификой данных предметной области, отраженной в концептуальной модели, а с другой стороны - типом конкретной СУБД (МБД), устанавливающей логическую и физическую организацию.

Для работы с БД используется специальный обобщенный инструментарий в виде СУБД (МБД), предназначенный для управления БД и обеспечения интерфейса пользователя.

Основные стандарты СУБД:

независимость данных на концептуальном, логическом, физическом уровнях;
универсальность (по отношению к концептуальному и логическому уровням, типу ЭВМ);
совместимость, неизбыточность;
безопасность и целостность данных;
актуальность и управляемость.

Существуют два основных направления реализации СУБД: программное и аппаратное.

Программная реализация (в дальнейшем СУБД) представляет собой набор программных модулей, работает под управлением конкретной ОС и выполняет следующие функции:

описание данных на концептуальном и логическом уровнях;
хранение данных;
поиск и ответ на запрос (транзакцию);
внесение изменений;
обеспечение безопасности и целостности. Обеспечивает пользователя следующими языковыми средствами:
- язык описания данных (ЯОД);
- язык манипулирования данными (ЯМД);
- прикладной (встроенный) язык данных (ПЯД, ВЯД).

Аппаратная реализация предусматривает использование так называемых машин БД (МБД). Их появление вызвано возросшими объемами информации и требованиями к скорости доступа. Слово «машина» в термине МБД означает вспомогательный периферийный процессор. Термин «компьютер БД» - автономный процессор БД или процессор, поддерживающий СУБД. Основные направления МБД:

- параллельная обработка;
- распределенная логика;
- ассоциативные ЗУ;
- конвейерные ЗУ;
- фильтры данных и др.

На рис. 4.3 представлена совокупность процедур проектирования БД, которые можно объединить в четыре этапа. На этапе формулирования и анализа требований устанавливаются цели организации, определяются требования к БД. Эти требования документируются в форме, доступной конечному пользователю и проектировщику БД. Обычно при этом используется методика интервьюирования персонала различных уровней управления.

Рис. 4.3.

Этап концептуального проектирования заключается в описании и синтезе информационных требований пользователей в первоначальный проект БД. Результатом этого этапа является высокоуровневое представление информационных требований пользователей на основе различных подходов.

В процессе логического проектирования высокоуровневое представление данных преобразуется в структуре используемой СУБД. Полученная логическая структура БД может быть оценена количественно с помощью различных характеристик (число обращений к логическим записям, объем данных в каждом приложении, общий объем данных и т.д.). На основе этих оценок логическая структура может быть усовершенствована с целью достижения большей эффективности.

На этапе физического проектирования решаются вопросы, связанные с производительностью системы, определяются структуры хранения данных и методы доступа.

Весь процесс проектирования БД является итеративным, при этом каждый этап рассматривается как совокупность итеративных процедур, в результате выполнения которых получают соответствующую модель.

Взаимодействие между этапами проектирования и словарной системой необходимо рассматривать отдельно. Процедуры проектирования могут использоваться независимо в случае отсутствия словарной системы. Сама словарная система может рассматриваться как элемент автоматизации проектирования.

Этап расчленения БД связан с разбиением ее на разделы и синтезом различных приложений на основе модели. Основными факторами, определяющими методику расчленения, помимо указанных на рис. 4.2, являются: размер каждого раздела (допустимые размеры); модели и частоты использования приложений; структурная совместимость; факторы производительности БД. Связь между разделом БД и приложениями характеризуется идентификатором типа приложения, идентификатором узла сети, частотой использования приложения и его моделью.

Модели приложений могут быть классифицированы следующим образом:

1. Приложения, использующие единственный файл;
2. Приложения, использующие несколько файлов, в том числе:
- допускающие независимую параллельную обработку;
- допускающие синхронизированную обработку.

Сложность реализации этапа размещения БД определяется многовариантностью. Поэтому на практике рекомендуется в первую очередь рассмотреть возможность использования определенных допущений, упрощающих функции СУБД, например, допустимость временного рассогласования БД, осуществление процедуры обновления БД из одного узла и др. Такие допущения оказывают большое влияние на выбор СУБД и на рассматриваемую фазу проектирования.

Средства проектирования и оценочные критерии используются на всех стадиях разработки. Любой метод проектирования (аналитический, эвристический, процедурный), реализованный в виде программы, становится инструментальным средством проектирования, практически не подверженным влиянию стиля проектирования.

В настоящее время неопределенность при выборе критериев является наиболее слабым местом в проектировании БД. Это связано с трудностью описания и идентификации бесконечного числа альтернативных решений. При этом следует иметь в виду, что существует много признаков оптимальности, являющихся неизмеримыми, им трудно дать количественную оценку или представить их в виде целевой функции. Поэтому оценочные критерии принято делить на количественные и качественные. Наиболее часто используемые критерии оценки БД, сгруппированные в следующие категории:

количественные критерии - время, необходимое для ответа на запрос, стоимость модификации, стоимость памяти, время на создание, стоимость на реорганизацию;
качественные критерии - гибкость, адаптивность, доступность для новых пользователей, совместимость с другими системами, возможность конвертирования в другую вычислительную среду, возможность восстановления, возможность распределения и расширения.

Трудность в оценке проектных решений связана также с различной чувствительностью и временем действия критериев. Например, критерий эффективности обычно является краткосрочным и чрезвычайно чувствительным к проводимыми изменениям, а такие понятия, как адаптируемость и конвертируемость, проявляются на длительных временных интервалах и менее чувствительны к воздействию внешней среды.

Предназначение склада данных - информационная поддержка принятия решений, а не оперативная обработка данных. Потому БД и склад данных не являются одинаковыми понятиями. Архитектура ХД представлена на рис. 4.4.

Рис. 4.4.

Основные принципы организации ХД следующие.

1. Предметная ориентация. В оперативной БД обычно поддерживается несколько предметных областей, каждая из которых может послужить источником данных для ХД. Например, для магазина, торгующего видео- и музыкальной продукцией, интерес представляют следующие предметные области: клиенты, видеокассеты, CD-диски и аудиокассеты, сотрудники, поставщики. Явно прослеживается аналогия между предметными областями ХД и классами объектов в объектно-ориентированных БД. Это свидетельствует о возможности использования методов проектирования, применяемых в объектно-ориентированных СУБД.
2. Средства интеграции. Приведение разных представлений одних и тех же сущностей к некоторому общему типу.
3. Постоянство данных. В ХД не поддерживаются операции модификации в смысле традиционных БД. В ХД поддерживается модель «массовых загрузок» данных, осуществляемых в заданные моменты времени по установленным правилам в отличие от традиционной модели индивидуальных модификаций.
4. Хронология данных. Благодаря средствам интеграции реализуется определенный хронологический временной аспект, присущий содержимому ХД.

Основные функции репозитариев:

парадигма включения/выключения и некоторые формальные процедуры для объектов;
поддержка множественных версий объектов и процедуры управления конфигурациями для объектов;
оповещение инструментальных и рабочих систем об интересующих их событиях;
управление контекстом и разные способы обзора объектов репозитария;
определение потоков работ.

Основными направлениями научных исследований в области БД являются:

- развитие теории реляционных БД;
- моделирование данных и разработка конкретных моделей разнообразного назначения;
- отображение моделей данных, направленных на создание методов их преобразования и конструирования коммутативных отображений, разработку архитектурных аспектов отображения моделей данных и спецификаций определения отображений для конкретных моделей данных;
- создание СУБД с мультимодельным внешним уровнем, обеспечивающих возможности отображения широко распространенных моделей;
- разработка, выбор и оценка методов доступа;
- создание самоописываемых БД, позволяющих применять единые методы доступа для данных и метаданных;
- управление конкурентным доступом;
- развитие системы программирования БД и знаний, которые обеспечивали бы единую эффективную среду как для разработки приложений, так и для управления данными;
- совершенствование машины БД;
- разработка дедуктивных БД, основанных на применении аппарата математической логики и средств логического программирования, а также пространственно-временных БД;
- интеграция неоднородных информационных ресурсов.

Бесплатная утилита AIDA32 в течении долгого времени была лучшей программой для сбора информации о системе, и не имела никаких достойных аналогов. Она предоставляла полную информацию почти по каждому аппаратному и программному обеспечению. А так же позволяла проверять окружение в сети и проводить тесты производительности памяти .

Однако, в марте 2004 года разработчик объявил о том, что развитие AIDA32 будет заморожено, а основное развитие будет перенесено в другую компанию. Где в последствии была продолжена разработка AIDA32, но уже в качестве коммерческого продукта под названием Everest. Когда в 2010 году Everest была приобретена FinalWare, разработка продукта Everest была прекращена. Тем не менее, сам продукт продолжил свое существование, но уже под именем AIDA64, который до сих пор существует. К сожалению, у данного продукта есть только триальные версии.

Обзор бесплатных программ для сбора информации о компьютере

AIDA32 он же Everest Home для сбора информации о компьютере

Однако, вы все еще можете найти старую версию . И до сих пор существует бесплатная версия программы Everest под названием . Старая версия AIDA32 работает лучше при сборе данных об окружении в сети, в то время как Everest охватывает более современное оборудование. Так что не смотря на то, что это по сути один и тот же продукт, вы можете использовать сразу оба продукта, чтобы получить максимальный эффект.

Программа Belarc Advisor аналог AIDA32 для сбора информации о системе

Если вам необходимо провести инвентаризацию оборудования отдельного компьютера, то вам пригодится . Эта программа бесплатна для некоммерческого использования. Конечно, по своему охвату она уступает AIDA32, но у нее есть одно важное преимущество. Она активно развивается. Так что придет время, и программа обгонит AIDA32.

Программа HWiNFO удобная инвентаризация системы

SIW (System Information for Windows)

		Подробные результаты, портативный.
		Не поддерживает Windows 8 и выше. Бесплатная версия больше не обновляется.

PC Wizard

		Достаточно подробная информация. Неплохой бенчмаркинг. Регулярно обновляется
		Установщик содержит "Ask Toolbar" (можно не устанавливать)

Belarc Advisor

		Активно развивается
		Не такая мощная, как AIDA32

Соглашение об использовании материалов сайта

Просим использовать работы, опубликованные на сайте , исключительно в личных целях. Публикация материалов на других сайтах запрещена.
Данная работа (и все другие) доступна для скачивания совершенно бесплатно. Мысленно можете поблагодарить ее автора и коллектив сайта.

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Подобные документы

Создание программы для поиска минимума функции двух вещественных переменных в заданной области с помощью генетического алгоритма. Генетические алгоритмы и операторы. Создание начальной популяции. Размножение. Мутация и селекция. Тестирование программы.

курсовая работа , добавлен 22.02.2015

Программа реализации генетического алгоритма, использование визуальной среды программирования. Руководство пользователя, листинг программы. Возможность ввода параметров: объем популяции, число поколений, коэффициент скрещивания и мутации, число городов.

курсовая работа , добавлен 20.08.2009

Основные генетические операторы. Схема функционирования генетического алгоритма. Задачи, решаемые с помощью генетических алгоритмов. Математическая постановка задачи оптимизации. Решение Диофантова уравнения. Программная реализация. Создание пособия.

курсовая работа , добавлен 20.02.2008

Этапы работы генетического алгоритма, область его применения. Структура данных, генерация первоначальной популяции. Алгоритм кроссинговера - поиск локальных оптимумов. Селекция особей в популяции. Техническое описание программы и руководство пользователя.

реферат , добавлен 14.01.2016

Описание принципа работы генетического алгоритма, проверка его работы на функции согласно варианту на основе готовой программы. Основные параметры генетического алгоритма, его структура и содержание. Способы реализации алгоритма и его компонентов.

лабораторная работа , добавлен 03.12.2014

Первые работы по симуляции эволюции. Основные понятия генетических алгоритмов. Постановка задачи и функция приспособленности. Инициализация, формирование исходной популяции. Выбор исходной популяции для генетического алгоритма, решение задач оптимизации.

курсовая работа , добавлен 31.03.2015

Определение и описание "генетического алгоритма", идея которого состоит в организации эволюционного процесса, конечной целью которого является получение оптимального решения в сложной комбинаторной задаче. Пример его тривиальной реализации на C++.

контрольная работа , добавлен 24.05.2010

Последние статьи

2024-04-25 01:41:41
Атрибуты chkdsk. CHKDSK - что это? Служебная программа CHKDSK. CHKDSK - как запустить
2024-04-21 01:43:53
Почему Водафон идет по стопам МТС и вводит региональность?
2024-04-19 01:45:08
Антивирус Bitdefender: эффективный защитник Без вопросов