Converter discurso em texto
O Conversão da fala em texto pode ser feito tanto manualmente como automaticamente. O A transcrição manual é ainda claramente superior à transcrição automática em termos de qualidade.. No entanto, o processamento automático da fala para o texto também tem muitas vantagens. A maior vantagem é a velocidade com que a fala é convertida em escrita.
A conversão ou transcrição manual de uma entrevista em texto pode demorar muito tempo. À mão, dependendo da velocidade de digitação, cerca de 3 - 7 vezes o número de minutos de áudio é necessário. Com um programa apropriado de "discurso para texto", isto pode ser feito dentro de alguns minutos a segundos sem qualquer esforço.
Pode também encontrar muitas mais dicas úteis no nosso livro electrónico Gravação, dactilografia, análise - Guia para a realização de entrevistas e transcrições.
O livro está disponível como download gratuito: Descobrir tudo sobre Transcrição & Co agora!
Converter automaticamente a língua em texto
Com a ajuda da inteligência artificial (IA) é possível Converter automaticamente ficheiros áudio em texto. Existem agora muitos programas que convertem ficheiros de fala ou áudio em texto. Os fornecedores mais conhecidos incluem Google (Speech-to-Text), Apple (Siri), Amazon (Alexa) e Microsoft (Cortana); menos proeminentes são Voicedocs e EML. Na sua maioria, os programas podem processar ficheiros nos formatos áudio comuns (MP3 e WAV).
Outros formatos de ficheiro ou mesmo ficheiros de vídeo podem ser convertidos online ou com programas especiais (por exemplo, com o Online Audio Converter ou com o VLC Media Player). No caso de conversão automática da fala para texto, os ficheiros são normalmente armazenados temporariamente. No que diz respeito à protecção de dados, deve portanto informar-se previamente com os fornecedores individuais.
Estudo sobre a conversão do discurso em texto / Alemão
Numa estudo detalhado testámos o desempenho de programas que convertem áudio alemão em texto e comparámos os resultados dos seis programas mencionados. Em particular, os programas de fala para texto menos conhecidos dos fornecedores Voicedocs e EML tiveram melhor desempenho em muitas categorias na língua alemã. Temos o prazer de fornecer este estudo a pedido.
O A qualidade das transcrições produzidas depende ainda muito dos ficheiros áudio.ou seja, o número de oradores, as condições de gravação (ambiente silencioso ou ruidoso), o vocabulário (simples ou especializado) e desvios da língua padrão (sotaques ou dialectos). Em condições perfeitas, o reconhecimento automático da fala já pode alcançar resultados aceitáveis; com qualquer restrição (por exemplo, tão poucos como dois oradores), a qualidade da conversão da fala em texto cai significativamente.
A qualidade dos programas de linguagem automática para texto é altamente variável para o alemão. Deve-se sempre fazer um teste com antecedência.
Para evitar surpresas desagradáveis, é aconselhável fazer primeiro uma transcrição de teste ao transcrever automaticamente da fala para o texto. Isto é possível connosco gratuitamente. Sem quaisquer obrigações pode Transcrição gratuita da amostra dos primeiros 2 minutos do seu ficheiro. receber uma transcrição de amostra. Tudo o que tem de fazer é enviar-nos o seu ficheiro e receberá a transcrição da amostra e informações detalhadas sobre o resultado. Clique aqui para o formulário de encomenda:
Encomende já a sua conversão de discurso para texto!
Todas as transcrições criadas com IA são verificadas manualmente por nós. Durante a verificação pós-transcrição, os erros grosseiros são corrigidos e os discursos são atribuídos aos oradores individuais. Geralmente, a maioria dos programas de fala para texto ainda não atribui oradores de forma fiável. Isto deve ser feito manualmente. É portanto necessária uma correcção posterior, mesmo com o melhor programa e a melhor qualidade.
Em suma, o esforço de transcrição automática da fala para o texto é, portanto, ainda muito grande e só pode ser recomendado nos casos em que os requisitos para o material a ser transcrito (boa qualidade de áudio, de preferência apenas um altifalante, sem dialecto) sejam cumpridos. Assim, a qualidade consistente e fiável e a exactidão das transcrições só podem ser alcançadas através da edição manual de discursos para textos. As nossas transcrições criadas manualmente têm geralmente um nível de qualidade de pelo menos 97% e são assim significativamente mais correctas do que qualquer transcrição criada usando IA.
Outras perguntas e respostas
Para a conversão de Discurso ao texto existem basicamente dois métodos:
Com o reconhecimento automático da fala uma máquina transcreve a palavra falada em texto. Para gravações com uma pessoa sem dialecto e ruído de fundo, isto já funciona razoavelmente bem. Com vários oradores, a qualidade é actualmente medíocre, na melhor das hipóteses.
Com transcrição manual, um humano digita a gravação de voz. O manual Transcrever ainda alcança uma qualidade muito superior à da gravação mecânica.
Para a conversão automática de Discurso ao texto há uma série de fornecedores onde isto é Reconhecimento da fala parcialmente oferecido gratuitamente. Contudo, a qualidade é hoje em dia apenas medíocre para gravações com mais do que um orador.
Para transcrição manual há uma série de Serviços de transcrição e agências de dactilografia tal como o líder do mercado alemão abtipper.de.
Existe toda uma gama de fornecedores, alguns dos quais oferecem sistemas gratuitos de reconhecimento automático da fala. Reconhecimento da fala oferta.