Hospitality & Retail Review Intelligence Tutorial

Array ( [as_domain] => amazon.com [as_name] => Amazon.com, Inc. [asn] => AS16509 [continent] => North America [continent_code] => NA [country] => United States [country_code] => US )

Start Your Project

import undetected_chromedriver as uc from selenium.webdriver.common.by import By from selenium.webdriver.common.keys import Keys from time import sleep browser = uc.Chrome() browser.get("https://www.google.com/maps/search/starbucks/") sleep(5)

for c in cards: try: name = c.find_element(By.CLASS_NAME, "qBF1Pd").text except: name = "" try: rating = c.find_element(By.CLASS_NAME, "MW4etd").text except: rating = "" try: reviews = c.find_element(By.CLASS_NAME, "UY7F9").text except: reviews = "" try: address = c.find_element(By.CLASS_NAME, "rllt__details").text except: address = "" try: url = c.find_element(By.TAG_NAME, "a").get_attribute("href") except: url = "" gm_locations.append({ "store_name": name, "rating_summary": rating, "review_count": reviews, "address": address, "url": url })

cards = browser.find_elements(By.XPATH, '//div[@data-review-id]') for r in cards: try: author = r.find_element(By.CLASS_NAME, "d4r55").text except: author = "" try: rating = r.find_element(By.CLASS_NAME, "fzvQZe").get_attribute("aria-label") except: rating = "" try: text = r.find_element(By.CLASS_NAME, "wiI7pd").text except: text = "" try: date = r.find_element(By.CLASS_NAME, "rsqaWe").text except: date = "" gm_reviews.append({ "platform": "Google Maps", "store": loc["store_name"], "rating": rating, "review_text": text, "date": date, "author": author, "address": loc["address"] })

for c in cards: try: name = c.find_element(By.CLASS_NAME, "css-1egxyvc").text except: continue try: rating = c.find_element(By.CSS_SELECTOR, '[aria-label$="star rating"]').get_attribute("aria-label") except: rating = "" try: reviews = c.find_element(By.CLASS_NAME, "reviewCount").text except: reviews = "" try: url = c.find_element(By.TAG_NAME, "a").get_attribute("href") except: url = "" yelp_locations.append({ "store_name": name, "rating_summary": rating, "review_count": reviews, "url": url })

yelp_reviews = [] for loc in yelp_locations[:20]: browser.get(loc["url"]) sleep(4) Scroll: for _ in range(20): browser.find_element(By.TAG_NAME, "body").send_keys(Keys.END) sleep(1) Extract reviews: blocks = browser.find_elements(By.XPATH, '//li[contains(@class,"review")]') for b in blocks: try: text = b.find_element(By.CLASS_NAME, "comment").text except: text = "" try: rating = b.find_element(By.XPATH, './/div[contains(@aria-label,"star rating")]').get_attribute("aria-label") except: rating = "" try: date = b.find_element(By.CLASS_NAME, "css-chan6m").text except: date = "" yelp_reviews.append({ "platform": "Yelp", "store": loc["store_name"], "rating": rating, "review_text": text, "date": date })

ta_reviews = [] for url in trip_urls[:10]: browser.get(url) sleep(4) blocks = browser.find_elements(By.XPATH, '//div[contains(@data-test-target,"review")]') for b in blocks: try: text = b.find_element(By.CLASS_NAME, "QewHA").text except: text = "" try: rating = b.find_element(By.CSS_SELECTOR, "svg[aria-label]").get_attribute("aria-label") except: rating = "" try: date = b.find_element(By.CLASS_NAME, "euPKI").text except: date = "" ta_reviews.append({ "platform": "TripAdvisor", "rating": rating, "review_text": text, "date": date })

keywords = { "service": ["slow", "rude", "bad service"], "cleanliness": ["dirty", "unclean", "messy"], "price": ["expensive", "overpriced"], "taste": ["bad taste", "not good", "cold food"], "waiting": ["long wait", "delay"] }

Platform	Challenges	Solutions
Google Maps	dynamic content + anti-bot	undetected-chromedriver, slow scroll, proxies
Yelp	rate-limiting	user-agent rotation
TripAdvisor	varied HTML structure	adaptive parsers

Platform

Challenges

Solutions

Google Maps

dynamic content + anti-bot

undetected-chromedriver, slow scroll, proxies

Yelp

rate-limiting

user-agent rotation

TripAdvisor

varied HTML structure

adaptive parsers

Array ( [as_domain] => amazon.com [as_name] => Amazon.com, Inc. [asn] => AS16509 [continent] => North America [continent_code] => NA [country] => United States [country_code] => US )

Start Your Project

Our Data Drives Impact - Real Client Stories