
Título: Web Scraping com Python – 3ª Edição: Coletando dados da web moderna
Autor: Ryan Mitchell
Sinopse: Se a programação é como mágica, então o web scraping é certamente uma forma de aplicação dessa mágica. Ao escrever um programa automatizado simples, você pode consultar servidores da web, solicitar dados e analisá-los para extrair as informações necessárias. Esta terceira edição, totalmente atualizada, não só apresenta você ao web scraping, mas também serve como um guia abrangente para coletar quase todos os tipos de dados disponíveis na web. A Parte I deste livro tem como foco os princípios básicos do web scraping: como utilizar Python para solicitar informações de um servidor web, realizar o tratamento básico da resposta do servidor e começar a interagir com sites de forma automatizada. A Parte II explora uma variedade de ferramentas e aplicações mais específicas para se adequar a qualquer cenário de web scraping que você provavelmente encontrará. Este livro mostra como: • Fazer o parsing de páginas HTML complexas • Desenvolver crawlers com o framework Scrapy • Aprender métodos para armazenar os dados coletados • Ler e extrair dados de documentos • Limpar e normalizar dados mal formatados • Ler e escrever linguagens naturais • Rastrear formulários e logins • Fazer o scraping de JavaScript e rastrear APIs • Utilizar e escrever software de conversão de imagem em texto • Evitar armadilhas de scraping e bloqueadores de bots • Utilizar scrapers para realizar testes em seu site
Contexto da obra
No campo da Informática e da Computação, livros como este costumam interessar por base conceitual, prática e atualização. “Web Scraping com Python – 3ª Edição: Coletando dados da web moderna”, de Ryan Mitchell, publicado pela editora Novatec Editora, em 2024 e com 384 páginas, integra a categoria Livros de Informática e Computação. Na prática, isso ajuda a explicar por que obras assim costumam circular entre formação e uso técnico.
Editora: Novatec Editora
Páginas: 384
Ano: 2024
Edição:
Linguagem: português
ISBN: 8575229230
ISBN13: 9788575229231
Sobre a editora
Os livros da editora Novatec Editora oferecem uma experiência de leitura focada em conteúdos técnicos e práticos, com forte ênfase em tecnologia, programação, administração de sistemas e negócios. O catálogo privilegia obras que combinam explicações detalhadas com exemplos aplicados, como guias para administração de Linux, desenvolvimento em Python, e análise de redes sociais, além de livros que orientam sobre marketing digital e investimentos imobiliários. A linguagem costuma ser clara e direta, adequada tanto para autodidatas quanto para profissionais e estudantes universitários, com ritmo que varia entre o didático e o prático, sem perder a objetividade.
