ВИРТУАЛЬНАЯ
СПРАВОЧНАЯ
СЛУЖБА
КОРПОРАЦИЯ УНИВЕРСАЛЬНЫХ НАУЧНЫХ БИБЛИОТЕК
международный проект ВСС КОРУНБ

Главная О проекте Библиотеки-участницы Помощь "Библиограф+" Публикации donate!


БИБЛИОТЕКИ-УЧАСТНИЦЫ КОРУНБ

Просмотр запроса № 20341

№ 20341  |  распечатать  |  оцените ответ  |  комментарий для библиографа  | 


Добрый день! Вопрос из области компьютерной лингвистики. Подскажите, пожалуйста, где можно почитать про различные методы автоматического распознавания кодировки и языка текстового файла? Интересуют описания самих алгоритмов, а также желателен пример их реализации на каком-либо языке программирования. Спасибо!
Ответ: Здравствуйте. Для начала работы предлагаем Вам следующий список литературы (источники: ПС: Yandex, БД МАРС, Сводный каталог по НТЛ):

1. Автоматическое определение кодировки текстовых файлов [Электронный ресурс] // Src-CODE.Net : [сайт]. – [Б.м.], 2014. – URL: http://src-code.net/avtomaticheskoe-opredelenie-kodirovki-tekstovyx-fajlov/ (24.07.2014)

2. Алгоритм автоматического перевода описаний изобретений с английского языка на русский / А.Л. Василевский [и др.]. – М. ЦНИИПИ, 1972. – 157 с. – (Труды ЦНИИПИ ; № 3).

3. Белоус М. Readiris 12 / М. Белоус, Я. Шпунт // PC Magazine. – 2010. – № 2. – С. 10.

Аннот.: Программа оптического распознавания текстов с русскоязычным интерфейсом в сравнении с FineReader.

4. Корнеев А.П. Программа FineReader: распознавание отсканированного и сфотографированного текста, а также перевод PDF-файлов в текстовые / Корнеев А.П., Иванова А.А., Прокди Р.Г. – СПб. : Наука и техника, 2010. – 80 с.

Аннот.: Дается описание методики распознавания отсканированного и/или сфотографированного текста с помощью самой лучшей и популярной программы FineReader, специально для этого предназначенной.

5. Методы распознавания текстов [Электронный ресурс] // Хабрахабр : [сайт]. – [Б.м.], 2006–2014. – URL: http://habrahabr.ru/post/112442/ (24.07.2014)

6. Михайлов Д.В. Теоретические основы построения открытых вопросно-ответных систем. Семантическая эквивалентность текстов и модели их распознавания / Михайлов Д.В., Емельянов Г.М. ; Новгород. гос. ун-т им. Ярослава Мудрого. – Вел. Новгород, 2010. – 286 с.

7. ПО для распознования текста [Электронный ресурс] // Ключ : [сайт]. – [Б.м.], [2012]. – URL: http://klyuch.my1.ru/publ/komp_internet_statja/po_dlja_raspoznovanija_teksta/1-1-0-36 (24.07.2014)

8. Рощин И. Программа для поиска и замены // Радиомир. Ваш компьютер. – 2005. – № 10. – С. 38–40. – Продолж. ; Начало в №№ 8–9. ; То же [Электронный ресурс]. – URL: http://ivr.webzone.ru/articles/mreplace/index.htm (24.07.2014)

9. Сысойкина М. Новинки ПО // Мир ПК. – 2011. – № 7. – С. 40. ; То же [Электронный ресурс]. – URL: http://www.osp.ru/pcworld/2011/07/13009286/ (24.07.2014)

10. Ян Д.Е. Исследование, развитие и реализация методов автоматического распознавания рукописных текстов в компьютерных системах : дис. … канд. физико-матем. наук : 05.13.18. / Ян Давид Евгеньевич. – М., 2003. – 179 с. ; Оглавление; Введение; Заключение; Список лит. к дис. [Электронный ресурс]. – URL: http://www.dissercat.com/content/issledovanie-razvitie-i-realizatsiya-metodov-avtomaticheskogo-raspoznavaniya-rukopisnykh-tek (24.07.2014)

11. Яцко В.А. Автоматическое распознавание жанра и адаптивное реферирование текста / В.А. Яцко, М.С. Стариков, А.В. Бутаков // Науч.–техн. информация. Сер. 2, Информ. процессы и системы. – 2010. – № 5. – С. 9–18. – Библиогр.: с. 18 (12 назв.).

Аннот.: Описывается экспериментальный метод автоматического распознавания жанра текста, основанный на статистических, лексических, синтаксических, позиционных и дискурсивных параметрах, на основе которых были разработаны алгоритмы адаптивного реферирования.

Являясь жителем Петербурга, Вы можете обратиться за помощью к библиографам РНБ.
[Ярославская областная универсальная научная библиотека им. Н.А. Некрасова]