Главная » Статьи » Свободное ПО |
Предоставьте надежные информационные ресурсы тем, кто принимает решения. Узнайте о простом, но полезном способе комбинировать возможности обработки данных awk и XML, который можно использовать для представления системных данных о UNIX® в удобной для восприятия форме, пригодной для отправки в корпоративную сеть или интернет. UNIX создает отчеты о производительности и загруженности системы, расходе ресурсов и отчеты с другой системной информацией, которая может использоваться управляющими персоналом и другими заинтересованными лицами. Внешние требования радикально изменили бизнес-процессы. Современная юридическая и административная среда делают эффективное использование критической информации обязательным для бизнеса. Требования, содержащиеся к примеру в законе Sarbanes-Oxley (Sarbanes-Oxley Act - SOX), принуждают к эффективному использованию и управлению информацией. Чтобы соответствовать требованиям федерального правительства о протоколировании финансовой информации, и способствовать собственному контролю с обратной связью за операционной, организации сегодня должны использовать методики управления сбором информации. Учитывая эти требования, управление сбором системных данных приобрело более важное значение, чем было при его традиционном назначении – мониторинг системы и инструмент для решения проблем. Файлы системного журнала являются наиболее важными и часто исследуемыми инструментами мониторинга системы. В UNIX® каждая программа, которая создает журнальные файлы, либо пишет информацию непосредственно в свой журнальный файл, либо собирает информацию посредством службы syslogd. Хотя регулярный просмотр и анализ этих файлов должен быть базовой методикой, используемой системными администраторами, реальность часто отличается от желаемого. Из-за значительных объемов данных, которыми надо управлять, многие системные администраторы не имеют ни времени, ни желания анализировать системные журналы. Однако, на современном рынке работа с системными журналами является наиболее важной задачей, игнорировать которую нельзя. Нежелание использовать журнальные файлы с данными может повлечь не только проблемы с правительственными службами, но также негативно повлиять на культуру работы предприятия в целом. Неспособность управлять этими ресурсами неизбежно приведет к неэффективному процессу системного администрирования, контроля и управления. Как следствие, также возросла важность методов, используемых при сборе и распространении информации. Учитывая эти обстоятельства, система управления журналами должна развиваться за рамки традиционного использования журнальных файлов. Предприятиям нужен простой способ управления большими объемами информации. Предприятие всегда заинтересовано во внедрении наиболее эффективного и менее затратного метода выполнения любой задачи. Поэтому, чтобы решение было реализовано, оно должно удовлетворять этим требованиям. Журнальные файлы содержат системные данные, которые можно использовать для определения текущих и будущих проблем. Однако, есть один небольшой недостаток. Несмотря на то, что журнальные файлы UNIX обычно являются текстовыми файлами (правда, есть несколько утилит, которые не могут конвертировать свои файлы в текстовый формат), формат представления данных в них не удобен для восприятия. К счастью, поскольку эти журнальные файлы являются текстовыми, можно использовать различные сценарии UNIX и тексто-обрабатывающие утилиты для изучения и анализа содержимого журнальных файлов. Одним из лучших инструментов UNIX для простых задач, связанных с извлечением и форматированием текста, является awk. Awk предоставляет сложный набор возможностей обработки текста. Awk – это сжатый, простой язык, который производит простой и «чистый» код. Этот инструмент содействует быстрой разработке, уменьшая возможность возникновения мелких ошибок, отодвигающих срок окончания работы. Awk предоставляет совершенные средства для преобразования журнальных файлов в другую форму. Но вот какой должна быть эта новая форма представления данных? Наиболее эффективным и менее затратным способом распространения информации является интранет или Интернет. Очевидно, что логичным выбором будет представление данных на Web-сайте. Для отображения данных из журнальных файлов на Web-сайте требуется преобразовать данные. Для конвертации данных в формат XML можно использовать awk, а затем, для вставки данных в HTML-страницы можно использовать блоки данных XML (XML data islands). Таким образом, информация будет представлена в понятном для пользователя, дружелюбном формате. Преимущество совместного использования HTML и XML состоит в том, что форматирование будет определено отдельно от данных. HTML обеспечивает форматирование и отображает детали, в то время как XML управляет структурами данных. Это разделение гарантирует что изменение лежащих в основе данных не повлечет изменения в HTML-коде. После создания HTML-страницы можно автоматически вставить в нее данные; можно вставить новый XML-файл поверх старого, с легкостью изменив Web-страницу так, чтобы та отображала данные, содержащиеся в новом XML. Объединение мощных возможностей awk и XML для поддержки мониторинга журнальных файлов является оптимальным решением для управления системными журналами. Далее в этой статье используется простой журнальный файл, содержащий временную метку и описание. Ниже в статье будет показана работа с awk для создания XML-данных, которые будут использоваться совместно с HTML.
Разработка XML-данных при помощи awk Каждый XML-файл должен начинаться с оператора объявления, который указывает, что данный файл содержит XML. Оператор объявления XML определяет версию и тип кодировки символов, используемой в данном документе. В данном примере для создания описательной информации XML, тегов XML, и записи данных из обычного файла в XML-файл используется awk. Утилита awk для каждой входной строки за раз выполняет только один отдельный блок кода. Awk имеет блоки начала, конца и середины. Прежде, чем awk-код (см. листинг 1)
будет готов к обработке текста из входного файла, его надо чуть-чуть
доработать. Для выполнения действий перед началом обработки текста в
awk можно определить начальный блок кода
FS , затем будет использоваться оператор print для помещения первых XML-выражений в файл данных.
Кавычкам в операторе Листинг 1. Блок BEGIN
Следующим шагом нужно создать выражения для обработки журнального файла. Пример ниже для обработки журнального файла создает файл с именем log.xml. Файл содержит дочерние элементы, которые, в свою очередь, также содержат дочерние элементы. Файл log.xml имеет структуру, показанную в листинге 2. Листинг 2. Элементы сообщения в журнале
В журнальном файле первым полем является временная метка внесения записи в журнал ($1), а вторым полем является описание сообщения ($2). Программа awk, используя код из листинга 3, преобразует данные журнального файла в XML-структуру. Листинг 3. Создание XML-структуры
Последним шагом в процессе создания XML-файла является определение блока Листинг 4. Блок END
В листинге 5 показана законченная awk-программа. Листинг 5. Законченная awk-программа
Эта тестовая awk-программа создает файл, который содержит данные из журнального файла. Она содержит необходимый код, который нужен для перемещения данных из журнального файла в XML-файл. Чтобы ограничить количество информации, выводимой на Web-странице, можно добавить условные и управляющие операторы awk, при помощи которых можно определить какие данные надо собирать и в конечном счете выводить. Например, XML-файл может не содержать сообщений за определенные даты, или журналы сообщений об ошибках могли бы не содержать сообщения об ошибках определенного типа.
Создание Web-страниц с замкнутыми блоками данных XML После того, как был создан XML-файл, необходимо создать структуру data island для размещения данных на HTML-странице. Data island является объектом исходных данных XML (XML Data Source Object - XML DSO), который находится на HTML-странице, отображаемой в Microsoft® Internet Explorer. XML DSO является элементом управления Microsoft ActiveX®, встроенным в Internet Explorer 4 или более поздней версии. XML DSO предоставляет решения для извлечения содержимого из внешнего XML-файла в страницу HTML. Объект XML DSO использует процесс, называемый связывание данных (data binding). При выполнении связывания данных элемент управления ActiveX общается непосредственно с другой Web-страницей или с XML-файлом, который содержит данные. При создании HTML-страниц, в них используются компоненты XML-кода, которые рассматриваются в этой статье. Тег Листинг 6. Атрибут ID тега XML
HTML-страница отображает XML-данные в таблице. Необходимо создать связь между XML-данными и HTML-атрибутом Листинг 7. Связывание XML-данных и HTML datasrc
Следующим шагом нужно создать шапку таблицы для идентификации элементов Листинг 8. Шапка таблицы
Используя
HTML-теги, которые могут принимать теги-источники данных (теги, которые
привязывают HTML к XML-данным), можно с легкостью форматировать и
отображать XML-данные (см. листинг 9). Сам по себе, элемент Листинг 9. Привязывание HTML к XML-данным
Листинг 10 содержит завершенный HTML-файл. Листинг 10. Законченный HTML-файл
Теперь у нас есть законченная HTML-страница с извлеченными журнальными данными. Awk для предприятия В этой статье были показаны впечатляющие результаты совместного применения awk и XML. В статье было показано как использовать XML для структуризации и объединения данных в информацию, подходящую как для размещения в сетях масштаба предприятия, так и для размещения ее в Интернете. Также было показано как сделать информацию доступной для широкого круга интересующихся лиц. Работа со своевременной и точной информацией увеличивает доходы предприятия. Поэтому, если руководители частной или государственной компании оперируют этой информацией, то это является существенным преимуществом данной компании. Методы, описанные в этой статье, можно приспособить под свои нужды, или использовать их в качестве основы собственного метода обработки информации, реализуемого при помощи awk и XML/HTML. По минимуму, эта статья должна укрепить понимание исключительной полезности awk в качестве основного инструмента для извлечения и подготовки данных и для обоснования нужности одного из назначений XML - универсальное хранилище данных.
| ||||||||||||||||||||||||||||
Просмотров: 1342 | |
Всего комментариев: 0 | |
Операционные Системы
[61]
ОС Open Source
|
Мобильный Linux [26] |
Сравнение ОС [7] |
Статьи о Linux [16] |
Свободное ПО [10] |
Програмирование [6] |
Не для нубов [5] |
Ядро [13] |
Хранилище данных [9] |
Устройства [1] |
Установка/конфигурирование/планиров [16] |
Файловые системы [3] |
Управление, основанное на политиках [1] |
Управление инфраструктурой [0] |
Серверы [5] |
Биографии [6] |
Прочее [25] |