Расшифровка аудиозаписей в текст, перевод речи в текст/транскрибация

02.08.2013
Эта статья о технологичном стартапе по расшифровке речи в текст “Slovomol” В стартапе slovomol.com мы объединили искусственный и человеческий интеллект, талант программистов и опытных расшифровщиков, воплотили в жизнь передовые технологии обработки аудио-видео контента в текст. http://www.slovomol.com/ Почему мы решили создать стартап именно в сфере распознавания речи? На Западе существует огромное количество компаний по расшифровке. Услугами transcription-компаний пользуются правительственные органы, юристы, врачи, преподаватели, бизнесмены,СМИ,- то есть самый широкий круг лиц. Это и есть наша целевая аудитория. На Западе следуют девизу «go paperless», и это касается всех сфер жизни и целого ряда бизнесов, где активно осуществляется переход на электронный документооборот. Рынок СНГ в этом плане «дикий» еще, и поскольку полноценной системы по рапознаванию слитной русской речи не предвидится в ближайшем будущем, мы решили работать в этом направлении и занять эту нишу на рынке СНГ. По нашим исследованиям, рынок расшифровки представлен порядка 30 компаниями и, конечно, фрилансерами. Согласитесь, цифра невпечатляющая. Качество продукта? Точность транскриптов Slovomol, как правило 98% и выше. Наш процесс транскрибирования выстроен таким образом, что каждый итоговый транскрипт проверяется несколько раз и разными людьми. Мы также производим необходимую проверку и поиск технических, специальных терминов и акронимов. Как происходит процесс транскрибирования? Аудиофайл дробится на части, затем происходит расшифровка каждого из фрагментов аудио. Когда каждый из фрагментов прошел тест на качество, они все последовательно соединяются в готовый продукт. Далее производится финальная вычитка текста. Зачем использовать фрагментацию аудио? Это ускоряет процесс транскрибирования, так как теперь мы можем пошагово отслеживать прогресс в расшифровке каждого фрагмента. И, следовательно, больше времени уделять корректуре. Мы создали команду из перфекционистов. Мы не ориентировались на уже существующие алгоритмы транскрибирования. Поэтому пришлось разработать собственный процесс с нуля. Об интерактивных стенограммах и пользе соцсетей. Наш новый вид услуг – интерактивные стенограммы – эффективный инструмент SEO, Вы получаете возможность связать стенограмму с YouTube видеороликом и получить HTML-код для встраивания в Ваш веб-сайт. Если Вы выложите часть стенограммы в открытый доступ, это может значительно улучшить поисковые позиции Вашего сайта в Google, Yandex и др.поиковых системах. И Ваши видео, и текстовая интерпретация видео теперь индексируются поисковыми системами. Так Ваш сайт и уникальный медиаконтент сможет продвигаться по поисковым запросам в Google. Пользователи смогут делиться понравившимися цитатами из Вашего видео и ссылкой на видео со своими друзьями в любой из выбранных соцсетей. Это может быть facebook, odnoklassniki, VK, Twitter и многие другие социальные сети. Итог: Максимальная производительность и лучшее качество транскриптов с наименьшими затратами времени и средств. Клиенты могут быть уверены, что получат транскрипт в кратчайшие сроки. И поскольку каждый расшифровщик корректирует лишь маленькую частью аудио, заключив с нами договор о неразглашении, конфиденциальность личной информации действительно гарантирована. «Slovomol» позволяет точно в срок получать транскрипты высокого качества для ваших аудио. Все, что нужно сделать, – это просто загрузить аудио или видео файл на сайт slovomol.com или с помощью Slovomol-приложения для iOS.
расшифровка аудио в текст