Como converter TMs e TBs do Studio

Não é segredo pra ninguém que eu sou adepta da interoperabilidade e do uso da ferramenta que melhor convém a um projeto (que nem sempre é a preferida do cliente 🙂 ). É muito comum um cliente mandar um arquivo sdlxliff com memória no formato sdltm e glossário em sdltb. Mas eu prefiro trabalhar no memoQ, outros colegas preferem o Wordfast, ou Memsource ou alguma outra CAT tool. E aí?

Aí a gente instala um conversor espertinho que converte esses arquivos num piscar de olhos! O nome dele é WfConverter. Foi criado para converter arquivos pensando no Wordfast, como o nome já indica, mas os formatos também servem lindamente no memoQ.

Primeiro, baixe o programa do site do Wordfast: http://wordfast.net/zip/WfConverter.zip

Depois, baixe o arquivo sqlite-dll-win32-x86-*.zip aqui. É um dll que vai fazer o programa funcionar. Se por acaso já tiver instalado o SQLite no computador (acho que só uma minoria vai ter, não é comum precisarmos dele), não precisa do dll.

Depois de descompactar os dois arquivos .zip, crie uma pasta (a minha é C:\WfConverter) e copie para lá o arquivo WfConverter.exe e o arquivo sqlite3.dll.

Clique com o botão direito do mouse no arquivo .exe e selecione “Fixar em Iniciar” e/ou “Fixar na barra de tarefas”, dependendo da sua preferência, para facilitar o acesso depois.

Agora chegamos à parte divertida: clique duas vezes no arquivo .exe para abri-lo.

Janela inicial do WfConverter

Clique no botão superior (a pasta com lupa) para selecionar o arquivo que deseja converter. Os formatos válidos são:

  • arquivos do Wordfast (.txt)
  • arquivos .csv
  • arquivos .tmx
  • arquivos de TM do Studio .sdltm
  • arquivos de TB (glossário) do Studio .sdltb
  • arquivos bilíngues do Studio .sdlxliff

É preciso selecionar o formato desejado, ele não tem uma opção “todos os arquivos compatíveis” ou algo parecido. Também não aceita que se arraste o arquivo para a janela. Precisa efetivamente navegar até o local do arquivo.

Neste caso, vou selecionar uma TM que recebi de um cliente:

WfConverter com TM selecionada para conversão

Agora é só clicar no botão Start e aguardar a conversão.

Quando a conversão terminar (em geral é rápido, leva só alguns segundos), aparece o número de TUs convertidas. O arquivo .tmx vai estar na mesma pasta do .sdltm.

Agora é só importar para a sua CAT tools de preferência.

O mesmo processo funciona para os arquivos de TB .sdltb, que são exportados como .csv.

Nunca precisei fazer outros tipos de conversão. Se alguém fizer e quiser contar o resultado, deixe um comentário ali embaixo, por favor. 🙂

Atalhos para os programas “de escritório” mais comuns

Usar atalhos de teclado é uma forma muito eficiente de trabalhar: aumenta a produtividade e diminui a chance de lesões causadas pelo uso excessivo do mouse. Para tradutores e outros profissionais que passam muitas horas na frente do computador, isso pode fazer uma diferença gigantesca na saúde.

Aqui estão alguns atalhos importantes para os programas que em geral mais usamos no dia a dia, num oferecimento da newsletter do One Productivity.

OCR online com Office Lens e OneDrive

Nem sempre precisamos (ou temos à mão) um scanner e um programa de OCR para digitalizar um texto impresso. Tenho usado bastante o OneDrive para essas conversões e olha… estou gostando muito. Obviamente não vai funcionar perfeitamente em todo tipo de texto (nenhum programa de OCR funciona, aliás), mas em geral o resultado é mais do que satisfatório, especialmente em texto corrido.

Tenho usado o Office Lens para escanear o texto impresso. Se você tem OneDrive (vem na assinatura do Office 365 e também pode ser assinado separadamente), é só instalar o aplicativo no celular.

App OneDrive

Depois de aberto, clique no ícone de diafragma no canto inferior direito para abrir o Lens (conforme imagem acima).

Vou usar como exemplo o livro Explorando Teorias da Tradução, do Anthony Pym, traduzido por Rodrigo Borges de Faveri, Claudia Borges de Faveri e Juliana Steil.

Centralize o texto na tela, de forma a incluir tudo que deseja “escanear”. Quando estiver tudo nos conformes, clique no disparador (o círculo branco na parte inferior da tela).

O programa vai mostrar como ficou a imagem escaneada (acima). Se não gostar, clique no “x” no canto superior esquerdo. Se a imagem estiver a contento, clique no tique azul (se quiser escanear uma página só) ou no “+” (se pretender escanear várias páginas).

A partir da segunda página, clique na lixeira do alto da tela se não estiver contente com uma imagem.

Quando clicar no tique azul, depois de terminar de escanear tudo, vai aparecer a tela acima para definir o nome do arquivo e para que pasta ele vai ser mandado no OneDrive. Toque nos campos para fazer as alterações necessárias ao nome do arquivo ou à pasta de destino.

A partir daqui, o processo vai continuar no computador (não consegui fazer funcionar pelo celular). Obviamente é preciso uma conexão à internet (4G ou Wi-Fi) para que os arquivos sejam enviados para o OneDrive.

Localize a pasta e o arquivo enviados do celular. Clique no arquivo que deseja abrir.

Observação importante: o OneDrive NÃO faz uma cópia do arquivo. Se quiser manter o PDF, faça uma cópia dele antes do OCR.

Clique em “Abrir”, no canto superior esquerdo.

Clique no botão azul “Editar no Word”.

Vai aparecer a mensagem acima. Clique em “Converter”. Lembrando de novo: apesar de a mensagem dizer que vai fazer uma cópia, NÃO VAI.

A conversão pode levar um pouco mais ou um pouco menos de tempo, dependendo do tamanho do arquivo, mas não costuma demorar. Quando terminar, aparecerá a mensagem acima. Para ver o texto convertido no Word, clique em “Editar”.

O texto aparecerá num documento do Word online, pronto para ser “manuseado” (editado, importado na sua CAT tool de preferência, etc). Provavelmente não ficará 100% perfeito (quase nenhum OCR fica), mas a qualidade, na maioria dos casos, é bem boa. No caso desse teste, logo acima da quebra de seção há um trecho com alguns errinhos, mas nada sério.

Como eu disse lá no começo, este método funciona melhor com texto corrido. Sempre que há muita formatação envolvida o OCR fica mais complicado. Mas para livros, handouts de cursos e materiais parecidos, é uma mão na roda.
E uma observação final: mesmo antes do OCR, os PDFs gerados pelo Office Lens são pesquisáveis. Ou seja, você também pode usar o aplicativo para escanear textos de referência que não precisam ser convertidos para o Word, mas quer deixar guardados para consulta posterior. Quando quiser, é só abrir no visualizador de PDF e fazer a busca por palavra como em qualquer outro arquivo (usando Ctrl + F no Windows, Cmd + F no Mac).

Bate-papo sobre CAT tools

Há alguns dias fui gravar um bate-papo sobre CAT tools com a Caroline Santiago, o Petê Rissatti e o William Cassemiro para o programa de pós-graduação da Cult/Estácio. Acabamos nos empolgando na conversa e rendeu um vídeo de 45 minutos com as informações básicas para quem não conhece essas ferramentas.

Novo recurso de acessibilidade no site

Graças à dica do William Cassemiro, da Translators101, conheci hoje o Audima, que converte todo o texto de um site em áudio. Assim, pessoas com deficiência visual ou qualquer outro tipo de dificuldade de leitura podem entender os textos publicados.

A instalação do plugin conforme as instruções do site foi rapidíssima, e em menos de cinco minutos estava tudo funcionando bonitinho. 🙂

Assim, a partir de agora, no alto de cada post aqui do Tradução via Val aparecerá um player com o áudio correspondente. Infelizmente, pela estrutura do site, funcionará apenas nos posts em português. Vou tentar descobrir como fazer com os poucos posts em inglês que tenho aqui.