A diferencia de un archivo de texto, no puede editar un PDF directamente. Hay varias formas de generar archivos PDF utilizando texto. Pero, ¿qué pasa si quieres ir al revés y convertir archivos PDF en archivos de texto?
Afortunadamente, Linux te permite modificar fácilmente estos archivos desde la terminal. Este artículo demostrará cómo convertir un archivo PDF en un documento de texto en Linux.
Convertir PDF a texto desde la terminal
Poppler es una biblioteca de software utilizada para renderizar y modificar archivos PDF. Contiene una utilidad, conocida como pdftotext, que permite a los usuarios generar archivos de texto a partir de archivos PDF. Desde poppler-utils no es parte de los paquetes estándar de Linux, tendrá que instalarlo manualmente usando un administrador de paquetes.
En Ubuntu y Debian:
sudo apt install poppler-utils
Para instalar Poppler en Arch Linux:
sudo pacman -S poppler
Instalando el poppler-utils package en CentOS, Fedora y otras distribuciones basadas en RHEL es fácil.
sudo dnf instalar poppler-utils
sudo yum instalar poppler-utils
Convertir un PDF completo en texto
La sintaxis básica del comando pdftotext es:
pdftotext [opciones] pdffile archivo de texto
...dónde archivo PDF es la ruta absoluta o relativa al archivo PDF, y Archivo de texto es el nombre del archivo de salida.
Por ejemplo, para convertir lorem-ipsum.pdf a un archivo de texto:
pdftotext lorem-ipsum.pdf text.txt
Si el archivo que está convirtiendo tiene marcas de agua o texto sin alinear, puede descartarlos en la salida usando el -nodiag bandera.
pdftotext -nodiag lorem-ipsum.pdf texto aleatorio
Procesar páginas dentro de un rango específico
Utilizar el -F y -l marque si desea convertir páginas que se encuentran dentro de un rango específico. Por ejemplo, para convertir las páginas de una a cinco en lorem-ipsum.pdf textear:
pdftotext -f 1 -l 5 lorem-ipsum.pdf salida.txt
Para convertir solo la primera página del archivo PDF:
pdftotext -f 1 -l 1 lorem-ipsum.pdf salida.txt
Convertir archivos PDF protegidos con contraseña a texto
Pdftotext puede incluso convertir archivos PDF protegidos con contraseña en archivos de texto. La -upw y -opw banderas, que representan contraseña de usuario y contraseña de propietario respectivamente, ocúpese del proceso de autenticación mientras convierte los archivos PDF.
pdftotext -upw contraseña lorem-ipsum.pdf salida.txt
pdftotext -opw contraseña lorem-ipsum.pdf salida.txt
Asegúrate de reemplazar contraseña con la contraseña del archivo PDF.
También puede combinar varios indicadores para obtener el resultado deseado. Por ejemplo, para convertir las páginas uno a tres de un PDF protegido con contraseña en texto:
pdftotext -f 1 -l 3 -upw contraseña lorem-ipsum.pdf salida.txt
Relacionados: Cómo convertir un archivo PDF a imágenes en Linux
Convertir PDF gráficamente a un archivo de texto
Si trabajar con la línea de comandos no es lo tuyo, puedes convertir archivos PDF en archivos de texto usando un software gráfico como Calibre. Es una aplicación de gestión de libros electrónicos que puede utilizar para ver, organizar y modificar archivos PDF en su sistema.
Calibre está disponible en los repositorios oficiales de distribución de Linux y cualquiera puede descargarlo usando un administrador de paquetes.
Para instalar Calibre en Ubuntu y Debian:
sudo apt instalar calibre
En Arch Linux:
sudo pacman -S calibre
En distribuciones basadas en RHEL como CentOS y Fedora, puede descargar Calibre usando DNF o Yum.
sudo dnf instalar calibre
sudo yum instalar calibre
Cómo usar Calibre para convertir archivos PDF
Una vez instalado, inicie Calibre en su sistema usando el Menú de aplicaciones. Alternativamente, puede iniciar Calibre desde la terminal escribiendo:
calibre
Para generar archivos de texto usando PDF con Calibre:
- Haga clic en el Agregar libros opción del menú.
- Busque y seleccione el archivo PDF que desea convertir.
- Resalte el archivo PDF en el panel central y seleccione Convertir libros del menú.
- Desde el Formato de salida desplegable, seleccione TXT.
- Finalmente, haga clic en OK continuar.
Calibre ahora comenzará a convertir el archivo PDF especificado en un documento de texto. Puede comprobar el estado del proceso haciendo clic en el Trabajos opción, ubicada en la parte inferior derecha de la ventana.
Trabajar con archivos PDF en Linux
Cuando desee compartir un documento con alguien, convertirlo a PDF antes de compartirlo es la forma más eficaz. Antes, los usuarios tenían que instalar un visor de PDF dedicado en su sistema para mostrar archivos PDF, pero ahora, casi todos los navegadores vienen con un visor de PDF incorporado.
Puede encontrar varias aplicaciones que permiten a un usuario ver y editar archivos PDF fácilmente. Muchas instalaciones de Linux se envían con LibreOffice, un paquete de software de oficina, que se puede utilizar como editor de PDF.
¿Necesita editar un archivo PDF en Linux? Estos editores de PDF de Linux son de instalación gratuita y fáciles de usar.
Leer siguiente
- Linux
- Editor de PDF
- Linux
Deepesh es el editor junior para Linux en MUO. Ha estado escribiendo contenido informativo en Internet durante más de 3 años. En su tiempo libre, le gusta escribir, escuchar música y tocar la guitarra.
Suscríbete a nuestro boletín
¡Únase a nuestro boletín de noticias para obtener consejos técnicos, reseñas, libros electrónicos gratuitos y ofertas exclusivas!
Un paso más…!
Confirme su dirección de correo electrónico en el correo electrónico que le acabamos de enviar.