Автоматизация работы в офисе

Дипломная работа

Житомирское Высшее профессиональное училище №17

Специальность: оператор ЭВМ

г.Житомир, 2001 г.

Аннотация дипломной работы оператора ЭВМ ??? ??? на тему «Автоматизация работы в офисе»

Современное общество не может существовать без документооборота. Документы сопровождают нас на каждом шагу. Даже мелкая покупка товара в магазине сопровождается выдачей документа – кассового чека. Мы можем выбросить ненужный чек в урну сразу после покупки, но это не меняет дела. Все равно в магазине остается копия чека, которая еще долго будет храниться и учитываться.

Одна из задач, стоящих перед информатикой, как наукой, состоит в переводе документооборота из бумажной формы и электронную. Эту задачу решают путем разработки и внедрения аппаратных и программных средств и методов электронного документооборота.

В данной дипломной работе будут рассмотрены вопросы, касающиеся использования двух наиболее значительных программных средств автоматизации документооборота, которыми являются FineReader, программа, предназначенная для распознавания текстов на русском, английском, немецком, украинском и многих других языках, и Promt98, комплект программ, используемый для автоматического перевода текстов с английского, немецкого и французского языка на русский и с русского на английский, немецкий и французский.

Введение

Ежедневно в мире создаются миллиарды копий больших и малых документов. На производство и воспроизводство документов расходуется немыслимое количество бумаги и леса, а на учет, проверку и хранение документов тратится огромное количество времени.

Одна из основных задач информатики состоит в разработке и внедрении средств и методов использования вычислительной техники для перевода документооборота из бумажной формы в электронную. Современные сетевые технологии позволяют решить эту задачу, но пока лишь частично. Все банки мира уже связаны электронными сетями и финансовые документы циркулируют в основном в электронном виде. Постепенно выходят из употребления бумажные акции предприятий и другие ценные бумаги. Их заменяют электронные депозитарии – базы данных, в которых сведения об акционерах хранятся в виде записей.

Сравнительно недавно появились электронные деньги. Это тоже записи в базах данных. Движение электронных денег происходит по безбумажной технологии, путем переноса данных из одних записей в другие. Для персонального использования электронных денег служат пластиковые карты, содержащие сведения о владельце электронного счета на магнитной полосе, или смарт-карты, в которых те же данные записаны на небольшой плоской микросхеме, встроенной в карту.

По безбумажной технологии сегодня работают большинство средств массовой информации. Все этапы подготовки газеты, журнала, книги или рекламной листовки проводятся на компьютере. Многозадачные операционные системы типа Windows9Х позволяют одновременно готовить и редактировать тексты, создавать и обрабатывать иллюстрации, а компьютерные сети объединяют всех участников, работающих над одним проектом, в автономные рабочие группы.

Рабочая группа может обходиться без бумажных документов до полного завершения работы над проектом. Лишь когда работа завершается, создается итоговый бумажный документ. Это может быть как макет газеты, так и полный комплект чертежей, необходимый для постройки ракетного крейсера.

В тех случаях, когда исходные данные сразу имеют электронный вид, перевод документооборота на безбумажную технологию происходит сравнительно просто. Все этапы редактирования и корректуры выполняют в электронном виде с помощью специальных программных средств. Работа передается с одного рабочего места на другое по компьютерной сети, и все участники работы помогают друг другу и исправляют ошибки коллег без создания бумажных документов.

Возможно, в далеком будущем, когда все документы будут сразу готовиться только в электронном виде, человечество сможет перейти полностью к безбумажной технологии, и остатки лесов будут спасены от полного уничтожения, а целлюлозно-бумажные комбинаты перестанут сбрасывать отравленные воды в реки и озера. Однако сегодня персональный компьютер стоит еще не на каждом рабочем месте и не все участники документооборота объединены компьютерными сетями в рабочие группы. Поэтому основным препятствием на пути создания безбумажной технологии стоит проблема ввода исходных данных именно в электронном виде.

В информатике эта проблема решается созданием и внедрением специальных аппаратных и программных средств для перевода графической и текстовой информации в электронную форму.

1. Средства создания электронного документооборота

1.1. Автоматизация ввода информации в компьютер

Основным методом перевода бумажных документов в электронную форму является сканирование. Сканирование – это технологический процесс, в результате которого создается графический образ бумажного документа. Существует несколько разных видов сканеров, но в их основе лежит один и тот же принцип. Документ освещается светом от специального источника, а отраженный свет воспринимается светочувствительным элементом. Минимальный элемент изображения интерпретируется сканером как цветная (или серая) точка. Таким образом, в результате сканирования документа создается графический файл, в котором хранится растровое изображение исходного документа. Растровое изображение состоит, как известно, из точек. Количество точек определяется как размером изображения, так и разрешением сканера.

1.1.1. Сканеры для ввода текстов и иллюстраций

В настоящее время для ввода текстовой и графической информации используют следующие виды сканеров.

Ручные сканеры. Это самый простой вид сканеров, дающий наименее качественное изображение. Такой сканер не имеет движущихся частей, и сканирование производится путем перемещения сканера по документу.

Недостатком ручных сканеров является очень узкая полоса сканирования (стандартный лист бумаги приходится сканировать в несколько проходов), а также высокие требования к самому процессу сканирования. Так, если рука, держащая сканер, слегка подрагивает или движется рывками, говорить о хорошем качестве сканирования не приходится. Ручные сканеры пригодны для сканирования текстов, но использовать их для сканирования изображений (фотографий) затруднительно.

Листовые сканеры. Сканеры этого типа позволяют за одну операцию сканировать лист бумаги стандартного формата. Блок сканирования у таких сканеров неподвижен, а бумага протягивается мимо него при помощи специальных валиков (как в принтере). Листовые сканеры гарантируют хорошее качество сканирования. но они способны сканировать только отдельные листы. Перевести с их помощью в электронную форму страницу книги или разворот журнала невозможно.

Планшетные сканеры обеспечивают наилучшее качество и максимальное удобство при работе с бумажными документами. Под крышкой планшетного сканера располагается прозрачное основание, на которое укладывают документ. Блок сканирования перемещается вдоль документа внутри корпуса сканера. Продолжительность сканирования стандартного машинописного листа составляет от одной до нескольких секунд.

1.1.2. Специальные типы сканеров

Барабанные сканеры обеспечивают наивысшее разрешение сканирования, но они предназначены для сканирования не бумажных документов, а прозрачных материалов, например слайдов, негативов и т. п. В сканерах этого типа считывающая головка установлена неподвижно, а изображение, закрепленное на цилиндрическом барабане, вращается с высокой скоростью и сканируется построчно.

Сканеры форм – специальные сканеры для ввода информации с заполненных бланков. Это разновидность листовых сканеров. С помощью подобных устройств вводят данные из анкет, опросных листов, избирательных бюллетеней. От сканеров этого типа требуется не высокая разрешающая способность, а очень высокое быстродействие. В частности, для сканеров этого типа автоматизируют подачу бумажных листов в устройство.

Штрих-сканеры – разновидность ручных сканеров. Предназначены они для считывания штрих-кодов с маркировки товаров в магазинах. Штрих-сканеры позволяют автоматизировать процесс подсчета стоимости покупок. Они особенно удобны в торговых помещениях, оборудованных электронной связью и производящих расчеты с покупателями с помощью электронных платежных средств (кредитных карт, смарт-карт и т. п.).

1.2. Связь сканера с операционной системой

Для подключения сканера к компьютеру используют разные методы. Существуют сканеры со специальной платой расширения, так называемым контроллером. Плату устанавливают в одно из гнезд расширений материнской платы компьютера, а сканер подключают к разъему платы.

Некоторые сканеры подключают к свободному параллельному порту (порту принтера). В таком случае передача данных происходит медленнее, зато никаких дополнительных устройств для подключения сканера не требуется.

Наиболее производительные сканеры используют интерфейс SCSI, разработанный специально для подключения к компьютеру внешних устройств. Компьютер в этом случае должен иметь специальный контроллер, обеспечивающий работу с этим аппаратным интерфейсом. Такой контроллер чаще всего выполняется на плате расширения.

Поскольку аппаратные интерфейсы сканеров отличаются многообразием, были предприняты специальные меры для стандартизации программного интерфейса, обеспечивающего связь между сканерами и операционной системой. Этот интерфейс основан на специальном протоколе TWAIN. Если сканер поддерживает данный протокол, то операционная система Windows9Х способна обеспечить взаимодействие между сканером и программным приложением, предназначенным для работы с ним. Все современные сканеры поддерживают стандарт TWAIN.

1.2.1. Особенности Windows95

Операционная система Windows95 появилась, когда сканеры еще не считались необходимыми компонентами настольной компьютерной системы, и по этой причине штатных средств поддержки стандарта TWAIN в Windows95 нет. При установке сканера в системе Windows95 необходимо использовать драйверы, поставляющиеся вместе с ним.

1.2.2. Особенности Windows98

Операционная система Windows98 уже осведомлена о наличии такого устройства как сканер. Стандарт TWAIN поддерживается в ней по умолчанию, а в случае присоединения к компьютерной системе сканера, в окне папки «Панель управления» появляется соответствующий значок, позволяющий производить настройку.

Таким образом, в большинстве программ работа со сканером производится при посредстве специального диалогового окна, обеспечивающего непосредственное взаимодействие со сканером. После того как пользователь дает команду на сканирование документа, данные передаются в программу, обратившуюся к сканеру, с использованием протокола TWAIN.

1.3. Автоматическое распознавание текстов

После обработки документа сканером получается графическое изображение документа (графический образ). Но графический образ еще не является текстовым документом. Человеку достаточно взглянуть на лист бумаги с текстом, чтобы понять, что на нем написано. С точки зрения компьютера, документ после сканирования превращается в набор разноцветных точек, а вовсе не в текстовый документ.

Проблема распознавания текста в составе точечного графического изображения является весьма сложной. Подобные задачи решают с помощью специальных программных средств, называемых средствами распознавания образов. Реальный технический прорыв в этой области произошел лишь в последние годы. До этого распознавание текста было возможно только путем сравнения обнаруженных конфигураций точек со стандартным образцом (эталоном, хранящимся в памяти компьютера). Авторы программ задавали критерий «похожести», используемый при идентификации символов.

Подобные системы назывались OCR (Optical Character Recognition – оптическое распознавание символов) и опирались на специально разработанные шрифты, облегчавшие такой подход. Если приходилось сталкиваться с произвольным и, тем более, сложным шрифтом, программы такого рода начинали давать серьезные сбои.

Современные научные достижения в области распознавания образов буквально перевернули представление об оптическом распознавании символов. Современные программы вполне могут справляться с различными (и весьма вычурными) шрифтами без перенастройки. Многие распознают даже рукописный текст.

1.3.1. Программы распознавания текстов

Поскольку потребность в распознавании текста отсканированных документов достаточно велика, неудивительно, что имеется значительное число программ, предназначенных для этой цели. Так как разные научные методы распознавания текста развивались независимо друг от друга, многие из этих программ используют совершенно разные алгоритмы.

Эти алгоритмы могут давать разные результаты на разных документах. Например, упоминавшиеся выше системы OCR, способны распознавать только стандартный специально подготовленный шрифт и дают на этом шрифте наилучшие результаты, которые не может превзойти ни одна из более универсальных программ.

Современные алгоритмы распознавания текста не ориентируются ни на конкретный шрифт, ни на конкретный алфавит. Большинство программ способно распознавать текст на нескольких языках. Одни и те же алгоритмы можно использовать для распознавания русского, латинского, арабского и других алфавитов и даже смешанных текстов. Разумеется, программа должна знать, о каком алфавите идет речь.

Нас, прежде всего, интересуют программы, способные распознавать текст, напечатанный на русском и украинском языках. Такие программы выпускаются в основном российскими производителями. Наиболее широко известны и распространены программы FineReader и CuneiForm. Мы подробно остановимся на программе FineReader, обеспечивающей высокое качество распознавания и удобство применения.

1.3.2. Программа FineReader

Программа FineReader выпускается российской компанией ABBYY Software (www.bitsoft). Эта программа предназначена для распознавания текстов на русском, английском, немецком, украинском, французском и многих других языках, а также для распознавания смешанных двуязычных текстов.

Программа имеет ряд удобных возможностей. Она позволяет объединять сканирование и распознавание в одну операцию, работать с пакетами документов (или с многостраничными документами) и с бланками. Программу можно обучать для повышения качества распознавания неудачно напечатанных текстов или сложных шрифтов. Она позволяет редактировать распознанный текст и проверять его орфографию.

FineReader работает с разными моделями сканеров. В частности, программа поддерживает стандарт TWAIN. Мы рассмотрим программу на примере версии 4.0, одной из последних версий на данный момент.

2. Распознавание документов в программе finereader

2.1. Окно программы

После установки программы FineReader в меню «Программы» Главного меню появляются пункты, обеспечивающие работу с ней. Окно программы имеет типичный для приложений Windows9Х вид и содержит строку меню, ряд панелей инструментов и рабочую область.

В левой части рабочей области располагается панель «Пакет», содержащая список графических документов, которые должны быть преобразованы в текст. Эти графические файлы рассматриваются как части одного документа. Результаты их обработки в дальнейшем объединяются в единый текстовый файл. Форма значка, отмечающего исходные файлы, указывает, было ли произведено распознавание.

Панель в нижней части рабочей области содержит фрагмент графического документа в увеличенном виде. С ее помощью можно оценить качество распознавания. Эту панель используют также при «обучении» программы в ходе распознавания текста.

Остальную часть рабочей области занимают окна документов. Здесь располагается окно графического документа, подлежащего распознаванию, а также окно текстового документа, полученного после распознавания.

В верхней части окна приложения под строкой меню располагаются панели инструментов. На приведенном рисунке включено отображение всех панелей, которые могут использоваться в программе FineReader.

Панель инструментов «Стандартная» содержит кнопки для открытия документов и для операций с буфером обмена. Прочие кнопки этой панели служат для изменения представления документа.

Панель «Scan&Read» содержит кнопки, соответствующие всем этапам превращения бумажного документа в электронный текст. Первая кнопка позволяет выполнить такое преобразование в рамках единой операции. Остальные кнопки соответствуют отдельным этапам работы и содержат раскрывающиеся меню, служащие для управления соответствующей операцией.

Панель «Распознавание» позволяет указать язык документа и вид шрифта. Последнее требуется делать только в тех случаях, когда документ имеет недостаточное качество печати.

Панель «Инструменты» используют при работе с исходным изображением. В частности, она позволяет управлять сегментацией документа. С помощью элементов управления этой панели задают последовательность фрагментов текста в итоговом документе.

Элементы управления панели «Форматирование» используют для изменения представления готового текста или при его редактировании.

2.2. Порядок распознавания текстовых документов

Преобразование бумажного документа в электронный происходит в три этапа. Каждый из этих этапов программа FineReader может выполнять как автоматически, так и под контролем пользователя. Если все этапы проводятся автоматически, то преобразование документа происходит за один прием.

Первый этап работы – сканирование. На этом этапе обычно используют сканер. Однако изображение с листа бумаги может быть преобразовано в цифровую форму и с помощью других средств, таких, например, как цифровые фотоаппараты и цифровые видеокамеры.

Второй этап работы – сегментация текста. Дело в том, что в бумажном документе, например на странице книги или журнала, текст не всегда располагается в фиксированном порядке. Он может размещаться в нескольких колонках, содержать иллюстрации (и подписи к ним). Дополнительные врезки и данные, представленные в таблицах, также могут запутать естественный порядок текста. Поэтому, прежде чем включать текст в документ, его разбивают на блоки, содержащие цельные фрагменты. Блоки распознают последовательно. Полученный текст включается в документ в порядке нумерации блоков.

Последний этап работы программы – непосредственно распознавание. Этот этап обычно не требует вмешательства пользователя, за исключением тех случаев, когда распознавание сопровождается «обучением».

Распознанный текст отображается в отдельном окне в виде форматированного текстового документа. Он «теряет связь» с исходным изображением и может редактироваться и форматироваться независимо от него. Программа выделяет цветом те символы, которые она сама рассматривает как неоднозначно опознанные. Это упрощает поиск ошибок. Средствами программы в полученном тексте можно также провести проверку грамматики.

Полученный текст можно сохранить в виде форматированного или неформатированного документа. Предусмотрена также возможность прямой передачи полученного текста в программы Word или Excel, а также

Если Вам нужна помощь с академической работой (курсовая, контрольная, диплом, реферат и т.д.), обратитесь к нашим специалистам. Более 90000 специалистов готовы Вам помочь.
Бесплатные корректировки и доработки. Бесплатная оценка стоимости работы.

Поможем написать работу на аналогичную тему

Получить выполненную работу или консультацию специалиста по вашему учебному проекту
Нужна помощь в написании работы?
Мы - биржа профессиональных авторов (преподавателей и доцентов вузов). Пишем статьи РИНЦ, ВАК, Scopus. Помогаем в публикации. Правки вносим бесплатно.

Похожие рефераты: