Вопрос Помощь по парсеру

Пользователь
Статус
Оффлайн
Регистрация
18 Фев 2022
Сообщения
594
Реакции[?]
100
Поинты[?]
40K
Ответ от chat.openai.com


Для парсинга информации с сайта hh.ru на Python можно использовать библиотеки requests и BeautifulSoup.

Вот пример кода для получения названия компании, номера телефона, почты и адреса:

Python:
import requests
from bs4 import BeautifulSoup

url = 'https://hh.ru/...'
response = requests.get(url)

soup = BeautifulSoup(response.text, 'html.parser')

company_name = soup.find('h1', {'class': 'header'}).text.strip()
phone_number = soup.find('span', {'class': 'phone'}).text.strip()
email = soup.find('a', {'class': 'email'}).text.strip()
address = soup.find('span', {'class': 'address'}).text.strip()

print(f"Название компании: {company_name}")
print(f"Номер телефона: {phone_number}")
print(f"Почта: {email}")
print(f"Адрес: {address}")
Здесь нужно заменить значение переменной url на URL страницы с информацией о компании на сайте hh.ru. Классы элементов страницы, содержащих нужную информацию, также могут отличаться в зависимости от конкретной страницы. Поэтому их нужно будет уточнить, просмотрев HTML-код страницы с помощью инструментов разработчика в браузере.
 
Эксперт
Статус
Оффлайн
Регистрация
13 Сен 2020
Сообщения
1,415
Реакции[?]
713
Поинты[?]
10K
Ответ от chat.openai.com


Для парсинга информации с сайта hh.ru на Python можно использовать библиотеки requests и BeautifulSoup.

Вот пример кода для получения названия компании, номера телефона, почты и адреса:

Python:
import requests
from bs4 import BeautifulSoup

url = 'https://hh.ru/...'
response = requests.get(url)

soup = BeautifulSoup(response.text, 'html.parser')

company_name = soup.find('h1', {'class': 'header'}).text.strip()
phone_number = soup.find('span', {'class': 'phone'}).text.strip()
email = soup.find('a', {'class': 'email'}).text.strip()
address = soup.find('span', {'class': 'address'}).text.strip()

print(f"Название компании: {company_name}")
print(f"Номер телефона: {phone_number}")
print(f"Почта: {email}")
print(f"Адрес: {address}")
Здесь нужно заменить значение переменной url на URL страницы с информацией о компании на сайте hh.ru. Классы элементов страницы, содержащих нужную информацию, также могут отличаться в зависимости от конкретной страницы. Поэтому их нужно будет уточнить, просмотрев HTML-код страницы с помощью инструментов разработчика в браузере.
ему, как видно на скрине, нужно нажать на кнопку, чтобы показать данные. тут нужен селениум
 
Участник
Статус
Оффлайн
Регистрация
26 Июн 2020
Сообщения
1,114
Реакции[?]
210
Поинты[?]
8K
Начинающий
Статус
Оффлайн
Регистрация
23 Дек 2018
Сообщения
76
Реакции[?]
6
Поинты[?]
0
ему, как видно на скрине, нужно нажать на кнопку, чтобы показать данные. тут нужен селениум
Да именно, я использовал api hh спрасил все что нужно* почти. API не дает мне номер телефона и почту (
Ответ от chat.openai.com


Для парсинга информации с сайта hh.ru на Python можно использовать библиотеки requests и BeautifulSoup.

Вот пример кода для получения названия компании, номера телефона, почты и адреса:

Python:
import requests
from bs4 import BeautifulSoup

url = 'https://hh.ru/...'
response = requests.get(url)

soup = BeautifulSoup(response.text, 'html.parser')

company_name = soup.find('h1', {'class': 'header'}).text.strip()
phone_number = soup.find('span', {'class': 'phone'}).text.strip()
email = soup.find('a', {'class': 'email'}).text.strip()
address = soup.find('span', {'class': 'address'}).text.strip()

print(f"Название компании: {company_name}")
print(f"Номер телефона: {phone_number}")
print(f"Почта: {email}")
print(f"Адрес: {address}")
Здесь нужно заменить значение переменной url на URL страницы с информацией о компании на сайте hh.ru. Классы элементов страницы, содержащих нужную информацию, также могут отличаться в зависимости от конкретной страницы. Поэтому их нужно будет уточнить, просмотрев HTML-код страницы с помощью инструментов разработчика в браузере.
Этот код уже отпадает так как он не робит
Идеи как за тебя парсер написать?
естественно :CoolCat::tearsofjoy:
 
Сверху Снизу