Подпишитесь на наш Telegram-канал, чтобы всегда быть в курсе важных обновлений! Перейти

Вопрос Помощь по парсеру

Начинающий
Начинающий
Статус
Оффлайн
Регистрация
23 Дек 2018
Сообщения
77
Реакции
7
сайт hh.ru(no ad)
1681159903944.png

на Python, может есть у кого идеи.
 
Ответ от chat.openai.com


Для парсинга информации с сайта hh.ru на Python можно использовать библиотеки requests и BeautifulSoup.

Вот пример кода для получения названия компании, номера телефона, почты и адреса:

Python:
Expand Collapse Copy
import requests
from bs4 import BeautifulSoup

url = 'https://hh.ru/...'
response = requests.get(url)

soup = BeautifulSoup(response.text, 'html.parser')

company_name = soup.find('h1', {'class': 'header'}).text.strip()
phone_number = soup.find('span', {'class': 'phone'}).text.strip()
email = soup.find('a', {'class': 'email'}).text.strip()
address = soup.find('span', {'class': 'address'}).text.strip()

print(f"Название компании: {company_name}")
print(f"Номер телефона: {phone_number}")
print(f"Почта: {email}")
print(f"Адрес: {address}")

Здесь нужно заменить значение переменной url на URL страницы с информацией о компании на сайте hh.ru. Классы элементов страницы, содержащих нужную информацию, также могут отличаться в зависимости от конкретной страницы. Поэтому их нужно будет уточнить, просмотрев HTML-код страницы с помощью инструментов разработчика в браузере.
 
Ответ от chat.openai.com


Для парсинга информации с сайта hh.ru на Python можно использовать библиотеки requests и BeautifulSoup.

Вот пример кода для получения названия компании, номера телефона, почты и адреса:

Python:
Expand Collapse Copy
import requests
from bs4 import BeautifulSoup

url = 'https://hh.ru/...'
response = requests.get(url)

soup = BeautifulSoup(response.text, 'html.parser')

company_name = soup.find('h1', {'class': 'header'}).text.strip()
phone_number = soup.find('span', {'class': 'phone'}).text.strip()
email = soup.find('a', {'class': 'email'}).text.strip()
address = soup.find('span', {'class': 'address'}).text.strip()

print(f"Название компании: {company_name}")
print(f"Номер телефона: {phone_number}")
print(f"Почта: {email}")
print(f"Адрес: {address}")

Здесь нужно заменить значение переменной url на URL страницы с информацией о компании на сайте hh.ru. Классы элементов страницы, содержащих нужную информацию, также могут отличаться в зависимости от конкретной страницы. Поэтому их нужно будет уточнить, просмотрев HTML-код страницы с помощью инструментов разработчика в браузере.
ему, как видно на скрине, нужно нажать на кнопку, чтобы показать данные. тут нужен селениум
 
ему, как видно на скрине, нужно нажать на кнопку, чтобы показать данные. тут нужен селениум
Да именно, я использовал api hh спрасил все что нужно* почти. API не дает мне номер телефона и почту (
Ответ от chat.openai.com


Для парсинга информации с сайта hh.ru на Python можно использовать библиотеки requests и BeautifulSoup.

Вот пример кода для получения названия компании, номера телефона, почты и адреса:

Python:
Expand Collapse Copy
import requests
from bs4 import BeautifulSoup

url = 'https://hh.ru/...'
response = requests.get(url)

soup = BeautifulSoup(response.text, 'html.parser')

company_name = soup.find('h1', {'class': 'header'}).text.strip()
phone_number = soup.find('span', {'class': 'phone'}).text.strip()
email = soup.find('a', {'class': 'email'}).text.strip()
address = soup.find('span', {'class': 'address'}).text.strip()

print(f"Название компании: {company_name}")
print(f"Номер телефона: {phone_number}")
print(f"Почта: {email}")
print(f"Адрес: {address}")

Здесь нужно заменить значение переменной url на URL страницы с информацией о компании на сайте hh.ru. Классы элементов страницы, содержащих нужную информацию, также могут отличаться в зависимости от конкретной страницы. Поэтому их нужно будет уточнить, просмотрев HTML-код страницы с помощью инструментов разработчика в браузере.
Этот код уже отпадает так как он не робит
Идеи как за тебя парсер написать?
естественно :CoolCat::tearsofjoy:
 
Назад
Сверху Снизу