Los audiolibros están ganando cada vez más popularidad frente a los libros electrónicos tradicionales. Son más convenientes ya que puedes escucharlos en cualquier momento y en cualquier lugar.

Puede convertir un PDF de un libro electrónico en un audiolibro con un simple script de Python. Usando algunas bibliotecas simples, puede desarrollar un proyecto que leerá un PDF y almacenará el audiolibro como un archivo nuevo.

Instalación de paquetes necesarios

Necesitas instalar el PyPDF3, pyttsx3, y pdffontanero paquetes para empezar. Puede instalar estos paquetes usando el administrador de paquetes pip. Asegúrate de que ya lo has hecho pip instalado en su sistema. Ejecute el siguiente comando en el símbolo del sistema para instalar los paquetes:

pepita Instalar en pc PyPDF3 pyttsx3 pdfplomero
  • Puedes usar el PyPDF3 biblioteca para leer y editar archivos PDF en Python.
  • los pyttsx3 biblioteca proporciona conversión de texto a voz.
  • pdffontanero es una biblioteca que le permite extraer texto y tablas de archivos PDF.
instagram viewer

El código utilizado en este proyecto está disponible en un repositorio GitHub y es gratis para su uso bajo la licencia MIT.

Convertir un PDF a un audiolibro usando Python

Una vez que haya instalado los paquetes anteriores, estará listo para importarlos a su archivo python:

importar PyPDF3
importar pyttsx3
importar pdffontanero

Debe proporcionar el nombre y la ubicación del archivo PDF que desea convertir. En aras de la simplicidad, puede utilizar cualquier archivo PDF de muestra. Cópielo en el mismo directorio que su secuencia de comandos y almacene su nombre en una variable; si se llama Lorem.pdf, por ejemplo:

archivo = 'Lorem.pdf'

A continuación, cree un objeto de archivo para el archivo PDF y un objeto de lector de PDF:

libro = abrir (archivo, 'rb')
pdfReader = PyPDF3.PdfFileReader (libro)

Más tarde, recorrerá todas las páginas del archivo PDF. Para encontrar el número total de páginas, utilice el número de páginas propiedad:

páginas = pdfReader.numPages

Ahora, está listo para extraer el texto del archivo PDF:

textofinal = ""

con pdffontanero.open(expediente) como pdf:
para i en el rango (0, páginas):
pagina = pdf.paginas[i]
texto = pagina.extraer_texto()
textofinal += texto

Use un bucle for para recorrer todas las páginas y extraer el texto del PDF. Puede usar el paquete pdfplomber para abrir el archivo pdf y el extraer_texto método para obtener texto de una página.

Con el texto completo almacenado en una variable, puede procesarlo más, según sus requisitos. Si desea convertir el texto en audio y guardarlo en un archivo nuevo, use el siguiente código:

motor = pyttsx3.init()
motor.guardar_en_archivo (textofinal, 'lorem.mp3')
motor.ejecutar y esperar()

Cuando usted ejecuta este código de Python, creará un archivo de audiolibro en su directorio.

Si no desea guardar el audiolibro y, por ejemplo, desea recitar el archivo PDF, puede usar el siguiente código en su lugar:

motor = pyttsx3.init()
motor.decir(texto final)
motor.ejecutar y esperar()

Cuando ejecute este script, recitará el archivo PDF.

Desarrollar proyectos usando Python

Python es conocido por su versatilidad. Puede crear fácilmente proyectos con aplicaciones prácticas utilizando Python.

Si está buscando ensuciarse las manos con el código Python, puede comenzar desarrollando miniproyectos. Algunas buenas ideas iniciales son una aplicación de prueba, un chatbot, un juego de serpientes, un acortador de URL, un web scraper o un convertidor de unidades.