Olá pessoal,
Mudando completamente o rumo das últimas postagens, vou deixar uma dica aqui: como editar arquivos PDF sem instalar nenhum programa!
Existem várias soluções pagas para isso. Algumas certamente são melhores (de cabeça lembro do Adobe Acrobat Pro DC, que custa R$60 mensais e do Foxit Phantom PDF, que custa quase R$450), mas todas são mais caras que a minha saída ;-)
- Primeira opção: Automator
Esta opção é para quem tem MacOs. Utiliza o Automator para isso.
(Vá nos aplicativos e abra o Automator)
(Escolha criar um novo documento)
(Escolha Workflow ou Fluxo de Trabalho e clique em Escolher)
(Escolha na aba da esquerda "Arquivos e Pastas e depois Escolher itens no Finder; depois arraste o Escolher itens no Finder para a área cinza)
(Faça a mesma coisa com PDF e Extrair texto do PDF. Este você vai arrastar para debaixo do item anterior)
(O resultado final deve ficar assim)
(Clique para fechar a janela e você será perguntado para escolher o nome e salvar seu fluxo de trabalho)
(Para executar, abra o Finder e clique em Run)
(Você irá escolher o arquivo em PDF...)
(... e o Automator mostra apenas que executou tudo sem erros)
(Agora temos dois arquivos: o .pdf original e o .txt que o Automator criou)
Basicamente é isso. O problema, como visto na foto acima, é que as tabulações ficam completamente zoneadas e as figuras são perdidas (ele tenta ler o texto da figura, se existir). Para páginas de texto puro, é uma mão na roda.
Para textos "digitalizados", imagino que não ficará bom. Nos textos que eu testei, nem saiu nada, a página de resultado ficou em branco.
Já os arquivos originalmente em PDF (livros texto e artigos científicos, por exemplo), ele leu bem e ainda respeitou as colunas (extraiu todo o texto da primeira coluna para depois extrair o da segunda coluna). Mas a formatação do texto foi pro saco mesmo.
Quando escolhemos o "Extract PDF Text", existe a opção de texto puro (.txt) ou formato .rtf. O formato .rtf gerará um texto que preserva um pouco mais a formatação, mas não espere mágica. Continua sendo texto, não tão puro quanto o .txt mas ainda assim MUITO longe de um .docx. Veja abaixo:
- Segunda opção: Google Docs
Essa outra opção é ainda mais fácil e funciona pra qualquer SO. Você só precisa ter uma conta do Google.
Abra seu navegador e vá em docs.google.com.
(Clique na pasta que está à direita)
(Clique em Upload para escolher seu arquivo de PDF)
(Escolha o arquivo e clique em Abrir)
(Vá em "Abrir com...)
(... e abra com Documentos Google - é o Word do Google)
(Este arquivo abriu assim e está editável)
(Esta página de livro abriu assim e preservou as colunas; também está editável)
Esta forma utilizando o Google Documentos me parace melhor. O texto é mais bem preservado que quando utilizado Automator. Parágrafos, tópicos, tudo é preservado.
Entretanto alguns textos, como o da última figura, a estrutura das colunas é preservada. Se você for copiar e colar, até fica razoável. Mas a edição fica muito prejudicada.
Vantagens e desvantagens: soluções pagas x soluções gratuitas, Automator x Google Docs. Escolha sua opção.
Até mais.
Nenhum comentário:
Postar um comentário