quarta-feira, 10 de junho de 2020

Dica: Como editar arquivos PDF sem instalar nenhum programa!

Olá pessoal,


Mudando completamente o rumo das últimas postagens, vou deixar uma dica aqui: como editar arquivos PDF sem instalar nenhum programa!

Existem várias soluções pagas para isso. Algumas certamente são melhores (de cabeça lembro do Adobe Acrobat Pro DC, que custa R$60 mensais e do Foxit Phantom PDF, que custa quase R$450), mas todas são mais caras que a minha saída ;-)

- Primeira opção: Automator

Esta opção é para quem tem MacOs. Utiliza o Automator para isso.

(Vá nos aplicativos e abra o Automator)

(Escolha criar um novo documento)

(Escolha Workflow ou Fluxo de Trabalho e clique em Escolher)

(Escolha na aba da esquerda "Arquivos e Pastas e depois Escolher itens no Finder; depois arraste o Escolher itens no Finder para a área cinza)

(Faça a mesma coisa com PDF e Extrair texto do PDF. Este você vai arrastar para debaixo do item anterior)

(O resultado final deve ficar assim)

(Clique para fechar a janela e você será perguntado para escolher o nome e salvar seu fluxo de trabalho)

(Para executar, abra o Finder e clique em Run)

(Você irá escolher o arquivo em PDF...)

(... e o Automator mostra apenas que executou tudo sem erros)

(Agora temos dois arquivos: o .pdf original e o .txt que o Automator criou)


Basicamente é isso. O problema, como visto na foto acima, é que as tabulações ficam completamente zoneadas e as figuras são perdidas (ele tenta ler o texto da figura, se existir). Para páginas de texto puro, é uma mão na roda.

Para textos "digitalizados", imagino que não ficará bom. Nos textos que eu testei, nem saiu nada, a página de resultado ficou em branco.

Já os arquivos originalmente em PDF (livros texto e artigos científicos, por exemplo), ele leu bem e ainda respeitou as colunas (extraiu todo o texto da primeira coluna para depois extrair o da segunda coluna). Mas a formatação do texto foi pro saco mesmo.

Quando escolhemos o "Extract PDF Text", existe a opção de texto puro (.txt) ou formato .rtf. O formato .rtf gerará um texto que preserva um pouco mais a formatação, mas não espere mágica. Continua sendo texto, não tão puro quanto o .txt mas ainda assim MUITO longe de um .docx. Veja abaixo:





- Segunda opção: Google Docs

Essa outra opção é ainda mais fácil e funciona pra qualquer SO. Você só precisa ter uma conta do Google.

Abra seu navegador e vá em docs.google.com.

(Clique na pasta que está à direita)

(Clique em Upload para escolher seu arquivo de PDF)

(Escolha o arquivo e clique em Abrir)

(Vá em "Abrir com...)

(... e abra com Documentos Google - é o Word do Google)

(Este arquivo abriu assim e está editável)

(Esta página de livro abriu assim e preservou as colunas; também está editável)

Esta forma utilizando o Google Documentos me parace melhor. O texto é mais bem preservado que quando utilizado Automator. Parágrafos, tópicos, tudo é preservado.

Entretanto alguns textos, como o da última figura, a estrutura das colunas é preservada. Se você for copiar e colar, até fica razoável. Mas a edição fica muito prejudicada.

Vantagens e desvantagens: soluções pagas x soluções gratuitas, Automator x Google Docs. Escolha sua opção.

Até mais.

Nenhum comentário:

Postar um comentário