Расшифровка аудиозаписей в текст, перевод речи в текст/транскрибация
02.08.2013
Эта статья о технологичном стартапе по расшифровке речи в текст “Slovomol”
В стартапе slovomol.com мы объединили искусственный и человеческий интеллект, талант программистов и опытных расшифровщиков, воплотили в жизнь передовые технологии обработки аудио-видео контента в текст. http://www.slovomol.com/
Почему мы решили создать стартап именно в сфере распознавания речи?
На Западе существует огромное количество компаний по расшифровке. Услугами transcription-компаний пользуются правительственные органы, юристы, врачи, преподаватели, бизнесмены,СМИ,- то есть самый широкий круг лиц. Это и есть наша целевая аудитория. На Западе следуют девизу «go paperless», и это касается всех сфер жизни и целого ряда бизнесов, где активно осуществляется переход на электронный документооборот.
Рынок СНГ в этом плане «дикий» еще, и поскольку полноценной системы по рапознаванию слитной русской речи не предвидится в ближайшем будущем, мы решили работать в этом направлении и занять эту нишу на рынке СНГ. По нашим исследованиям, рынок расшифровки представлен порядка 30 компаниями и, конечно, фрилансерами. Согласитесь, цифра невпечатляющая.
Качество продукта?
Точность транскриптов Slovomol, как правило 98% и выше. Наш процесс транскрибирования выстроен таким образом, что каждый итоговый транскрипт проверяется несколько раз и разными людьми. Мы также производим необходимую проверку и поиск технических, специальных терминов и акронимов.
Как происходит процесс транскрибирования?
Аудиофайл дробится на части, затем происходит расшифровка каждого из фрагментов аудио. Когда каждый из фрагментов прошел тест на качество, они все последовательно соединяются в готовый продукт. Далее производится финальная вычитка текста.
Зачем использовать фрагментацию аудио?
Это ускоряет процесс транскрибирования, так как теперь мы можем пошагово отслеживать прогресс в расшифровке каждого фрагмента. И, следовательно, больше времени уделять корректуре. Мы создали команду из перфекционистов. Мы не ориентировались на уже существующие алгоритмы транскрибирования. Поэтому пришлось разработать собственный процесс с нуля.
Об интерактивных стенограммах и пользе соцсетей.
Наш новый вид услуг – интерактивные стенограммы – эффективный инструмент SEO, Вы получаете возможность связать стенограмму с YouTube видеороликом и получить HTML-код для встраивания в Ваш веб-сайт. Если Вы выложите часть стенограммы в открытый доступ, это может значительно улучшить поисковые позиции Вашего сайта в Google, Yandex и др.поиковых системах. И Ваши видео, и текстовая интерпретация видео теперь индексируются поисковыми системами. Так Ваш сайт и уникальный медиаконтент сможет продвигаться по поисковым запросам в Google.
Пользователи смогут делиться понравившимися цитатами из Вашего видео и ссылкой на видео со своими друзьями в любой из выбранных соцсетей. Это может быть facebook, odnoklassniki, VK, Twitter и многие другие социальные сети.
Итог:
Максимальная производительность и лучшее качество транскриптов с наименьшими затратами времени и средств. Клиенты могут быть уверены, что получат транскрипт в кратчайшие сроки.
И поскольку каждый расшифровщик корректирует лишь маленькую частью аудио, заключив с нами договор о неразглашении, конфиденциальность личной информации действительно гарантирована.
«Slovomol» позволяет точно в срок получать транскрипты высокого качества для ваших аудио. Все, что нужно сделать, – это просто загрузить аудио или видео файл на сайт slovomol.com или с помощью Slovomol-приложения для iOS.
расшифровка аудио в текст