Вопрос Помощь по парсеру

pphub123321 · 10 Апр 2023

сайт hh.ru(no ad)

на Python, может есть у кого идеи.

hitogami · 11 Апр 2023

Идеи как за тебя парсер написать?

Michael Conors · 11 Апр 2023

Selenium

ampersand · 11 Апр 2023

Ответ от chat.openai.com

Для парсинга информации с сайта hh.ru на Python можно использовать библиотеки requests и BeautifulSoup.

Вот пример кода для получения названия компании, номера телефона, почты и адреса:

Python:

import requests
from bs4 import BeautifulSoup

url = 'https://hh.ru/...'
response = requests.get(url)

soup = BeautifulSoup(response.text, 'html.parser')

company_name = soup.find('h1', {'class': 'header'}).text.strip()
phone_number = soup.find('span', {'class': 'phone'}).text.strip()
email = soup.find('a', {'class': 'email'}).text.strip()
address = soup.find('span', {'class': 'address'}).text.strip()

print(f"Название компании: {company_name}")
print(f"Номер телефона: {phone_number}")
print(f"Почта: {email}")
print(f"Адрес: {address}")

Здесь нужно заменить значение переменной url на URL страницы с информацией о компании на сайте hh.ru. Классы элементов страницы, содержащих нужную информацию, также могут отличаться в зависимости от конкретной страницы. Поэтому их нужно будет уточнить, просмотрев HTML-код страницы с помощью инструментов разработчика в браузере.

Michael Conors · 11 Апр 2023

ampersand написал(а):
Ответ от chat.openai.com

Для парсинга информации с сайта hh.ru на Python можно использовать библиотеки requests и BeautifulSoup.

Вот пример кода для получения названия компании, номера телефона, почты и адреса:

Python:

import requests from bs4 import BeautifulSoup url = 'https://hh.ru/...' response = requests.get(url) soup = BeautifulSoup(response.text, 'html.parser') company_name = soup.find('h1', {'class': 'header'}).text.strip() phone_number = soup.find('span', {'class': 'phone'}).text.strip() email = soup.find('a', {'class': 'email'}).text.strip() address = soup.find('span', {'class': 'address'}).text.strip() print(f"Название компании: {company_name}") print(f"Номер телефона: {phone_number}") print(f"Почта: {email}") print(f"Адрес: {address}")

Здесь нужно заменить значение переменной url на URL страницы с информацией о компании на сайте hh.ru. Классы элементов страницы, содержащих нужную информацию, также могут отличаться в зависимости от конкретной страницы. Поэтому их нужно будет уточнить, просмотрев HTML-код страницы с помощью инструментов разработчика в браузере.

ему, как видно на скрине, нужно нажать на кнопку, чтобы показать данные. тут нужен селениум

hitogami · 11 Апр 2023

yoon bum написал(а):
ему, как видно на скрине, нужно нажать на кнопку, чтобы показать данные. тут нужен селениум

Что... Для чего дорогостоящая эмуляция, когда нужен один реквест

Пожалуйста, авторизуйтесь для просмотра ссылки.

pphub123321 · 11 Апр 2023

yoon bum написал(а):
ему, как видно на скрине, нужно нажать на кнопку, чтобы показать данные. тут нужен селениум

Да именно, я использовал api hh спрасил все что нужно* почти. API не дает мне номер телефона и почту (

ampersand написал(а):
Ответ от chat.openai.com

Для парсинга информации с сайта hh.ru на Python можно использовать библиотеки requests и BeautifulSoup.

Вот пример кода для получения названия компании, номера телефона, почты и адреса:

Python:

import requests from bs4 import BeautifulSoup url = 'https://hh.ru/...' response = requests.get(url) soup = BeautifulSoup(response.text, 'html.parser') company_name = soup.find('h1', {'class': 'header'}).text.strip() phone_number = soup.find('span', {'class': 'phone'}).text.strip() email = soup.find('a', {'class': 'email'}).text.strip() address = soup.find('span', {'class': 'address'}).text.strip() print(f"Название компании: {company_name}") print(f"Номер телефона: {phone_number}") print(f"Почта: {email}") print(f"Адрес: {address}")

Здесь нужно заменить значение переменной url на URL страницы с информацией о компании на сайте hh.ru. Классы элементов страницы, содержащих нужную информацию, также могут отличаться в зависимости от конкретной страницы. Поэтому их нужно будет уточнить, просмотрев HTML-код страницы с помощью инструментов разработчика в браузере.

Этот код уже отпадает так как он не робит

hitogami написал(а):
Идеи как за тебя парсер написать?

естественно :CoolCat:

:tearsofjoy:

Вопрос Помощь по парсеру

Похожие темы