Популярная информатика - страница 32
Для соединения «слов» тезаурусов в «фразы» применяются грамматические средства ИПЯ — правила составления поисковых образов с помощью дескрипторов ИПТ. Грамматики, применяемые в ИПЯ, бывают самыми различными. Одни регламентируют порядок дескрипторов в ПОДах и ПОЗах, другие — приписывают каждому дескриптору числа, характеризующие их значимость для поискового образа, третьи — указывают на роль каждого дескриптора при помощи специальных указателей и т. д. Применение грамматических средств в некоторых случаях позволяет более точно передавать содержание документов и тем самым улучшать поисковые характеры ИПС.
Подробное освещение классификационных и дескрипторных ИПЯ, информационно-поисковых тезаурусов и лингвистических (т. е. языковых) аспектов автоматизированных ИПС объясняется тем, что они оказывают решающее влияние на функционирование ИПС. Какой бы мощной и современной ЭВМ мы ни располагали, без правильно выбранного поискового языка вся система будет работать неэффективно.
Совершенствование ИПЯ во многой зависит от достижении в области теории семантической информации и направлений лингвистики. Поэтому появление автоматизированных ИПС послужило толчком к интенсивным исследованиям в области этих наук. Очень заманчиво, например, поручить вычислительной машине такую трудоемкую операцию, как реферирование документов. Одним из способов реализации этой идеи является выделение машиной в тексте таких предложений, которые содержат наиболее значимые для данной области знаний термины (а таковыми являются дескрипторы тезауруса этой области знаний, который хранится в памяти машины). Из этих предложений формируется реферат документа.
Другой, более сложный путь состоит в синтезе самих предложений после выделения в тексте наиболее значимых терминов. Все это требует от ЭВМ обширных «познаний» в области лингвистики. Решение все новых и новых проблем теоретической и прикладной лингвистики имеет конечной целью улучшение «взаимопонимания» между человеком и ЭВМ, а следовательно, и более полное использование возможностей вычислительной техники.
В последнее время в информатике прочно утвердился термин «лингвистическое обеспечение», который обобщает все те проблемы лингвистического характера, которые необходимо решить для обеспечения деятельности автоматизированных информационно-поисковых систем. Лингвистическое обеспечение — необходимый и очень важный элемент любой автоматизированной ИПС.
И проблемы технические
Вычислительные машины не сразу нашли широкое применение в информационном поиске. Причиной этому послужила высокая стоимость и низкая эффективность работы первых ИПС. Однако такое положение длилось не долго. Прогресс вычислительной техники сделал применение ЭВМ к поиску научной информации не только целесообразным с точки зрения эффективности поиска, но и выгодным экономически.
Автоматизированные ИПС (АИПС), реализованные на ЭВМ, появились на рубеже 60-х годов. Уже в 1961 г., по данным Центра по обработке научной информации Евратома, из 121 ИПС, созданных в разных странах мира, 16 были реализованы на ЭВМ. За прошедшие годы число АИПС неизмеримо возросло. Стремительным был и качественный рост АИПС, обусловленный с одной стороны, быстрым совершенствованием технических средств, с другой — развитием теоретических работ в области информатики.
Роль технических средств в обработке научной информации настолько велика, что само становление и развитие информатики связывают с ходом работ по механизации и автоматизации процессов обработки информации. В развитии информатики в связи с этим можно проследить три периода.
Первый период (1950-е годы) связан с первоначальными исследованиями и опытно-конструкторскими разработками, получившими широкое признание и заложившими здание современной информатики.
В течение второго периода (1960-е годы) в широких масштабах началось промышленное внедрение АИПС. К концу периода потребителей обслуживали сотни крупных информационных систем различных типов.
В настоящее время мы переживаем третий период развития информатики. В чем же его особенность?