Python: Script Un extracto automático de Google de tendencias para as palabras clave de busca de nicho

Script Python para capturar tendencias de suxestión automática

A Google Trends gústalle todo o mundo, pero é un pouco complicado cando se trata de palabras clave Long Tail. A todos gústanos o oficial servizo de tendencias de google para obter información sobre o comportamento da busca. Non obstante, dúas cousas impiden que moitos o utilicen para un traballo sólido;

 1. Cando precisa atopar novas palabras clave de nichohai Non hai datos suficientes en Google Trends 
 2. Falta de API oficial para facer solicitudes a tendencias de Google: cando facemos uso de módulos como pirtrendas, entón temos que usar servidores proxy ou quedamos bloqueados. 

Neste artigo, compartirei un script Python que escribimos para exportar palabras clave de tendencia a través de Google Autosuggest.

Obter e almacenar resultados de suxestión automática co paso do tempo 

Supoñamos que temos 1,000 palabras clave Seed para enviar a Google Autosuggest. A cambio, probablemente conseguiremos uns 200,000 Cola longa palabras clave. Despois, debemos facer o mesmo unha semana despois e comparar estes conxuntos de datos para responder a dúas preguntas:

 • Que consultas son novas palabras clave en comparación coa última vez? Probablemente sexa o caso que necesitamos. Google pensa que esas consultas son cada vez máis significativas; ao facelo, podemos crear a nosa propia solución de Google Autosuggest. 
 • Que consultas son palabras clave xa non tendencia?

O guión é bastante sinxelo e compartín a maior parte do código aquí. O código actualizado garda os datos das execucións pasadas e compara as suxestións ao longo do tempo. Evitamos as bases de datos baseadas en ficheiros como SQLite para facelo sinxelo, polo que todo o almacenamento de datos está utilizando ficheiros CSV a continuación. Isto permítelle importar o ficheiro en Excel e explorar as tendencias de palabras clave de nicho para a súa empresa.

Para utilizar este script Python

 1. Introduza o seu conxunto de palabras clave semente que se debería enviar ao autocompletado: keywords.csv
 2. Axuste a configuración do script para a súa necesidade:
  • IDIOMA: predeterminado "en"
  • PAÍS: por defecto "nós"
 3. Programa o script para que se execute unha vez á semana. Tamén podes executalo manualmente como queiras.
 4. Use keyword_suggestions.csv para unha análise máis detallada:
  • primeiro_visto: esta é a data na que a consulta apareceu por primeira vez no autosuggest
  • visto por última vez: a data na que se viu a consulta por última vez
  • é_novo: se first_seen == last_seen fixámolo en Certo - Só ten que filtrar este valor para obter as novas buscas de tendencia na suxestión automática de Google.

Aquí tes o código Python

# Pemavor.com Autocomplete Trends
# Author: Stefan Neefischer (stefan.neefischer@gmail.com)
import concurrent.futures
from datetime import date
from datetime import datetime
import pandas as pd
import itertools
import requests
import string
import json
import time

charList = " " + string.ascii_lowercase + string.digits

def makeGoogleRequest(query):
  # If you make requests too quickly, you may be blocked by google 
  time.sleep(WAIT_TIME)
  URL="http://suggestqueries.google.com/complete/search"
  PARAMS = {"client":"opera",
      "hl":LANGUAGE,
      "q":query,
      "gl":COUNTRY}
  response = requests.get(URL, params=PARAMS)
  if response.status_code == 200:
    try:
      suggestedSearches = json.loads(response.content.decode('utf-8'))[1]
    except:
      suggestedSearches = json.loads(response.content.decode('latin-1'))[1]
    return suggestedSearches
  else:
    return "ERR"

def getGoogleSuggests(keyword):
  # err_count1 = 0
  queryList = [keyword + " " + char for char in charList]
  suggestions = []
  for query in queryList:
    suggestion = makeGoogleRequest(query)
    if suggestion != 'ERR':
      suggestions.append(suggestion)

  # Remove empty suggestions
  suggestions = set(itertools.chain(*suggestions))
  if "" in suggestions:
    suggestions.remove("")
  return suggestions

def autocomplete(csv_fileName):
  dateTimeObj = datetime.now().date()
  #read your csv file that contain keywords that you want to send to google autocomplete
  df = pd.read_csv(csv_fileName)
  keywords = df.iloc[:,0].tolist()
  resultList = []

  with concurrent.futures.ThreadPoolExecutor(max_workers=MAX_WORKERS) as executor:
    futuresGoogle = {executor.submit(getGoogleSuggests, keyword): keyword for keyword in keywords}

    for future in concurrent.futures.as_completed(futuresGoogle):
      key = futuresGoogle[future]
      for suggestion in future.result():
        resultList.append([key, suggestion])

  # Convert the results to a dataframe
  suggestion_new = pd.DataFrame(resultList, columns=['Keyword','Suggestion'])
  del resultList

  #if we have old results read them
  try:
    suggestion_df=pd.read_csv("keyword_suggestions.csv")
    
  except:
    suggestion_df=pd.DataFrame(columns=['first_seen','last_seen','Keyword','Suggestion'])
  
  suggestionCommon_list=[]
  suggestionNew_list=[]
  for keyword in suggestion_new["Keyword"].unique():
    new_df=suggestion_new[suggestion_new["Keyword"]==keyword]
    old_df=suggestion_df[suggestion_df["Keyword"]==keyword]
    newSuggestion=set(new_df["Suggestion"].to_list())
    oldSuggestion=set(old_df["Suggestion"].to_list())
    commonSuggestion=list(newSuggestion & oldSuggestion)
    new_Suggestion=list(newSuggestion - oldSuggestion)
     
    for suggest in commonSuggestion:
      suggestionCommon_list.append([dateTimeObj,keyword,suggest])
    for suggest in new_Suggestion:
      suggestionNew_list.append([dateTimeObj,dateTimeObj,keyword,suggest])
  
  #new keywords
  newSuggestion_df = pd.DataFrame(suggestionNew_list, columns=['first_seen','last_seen','Keyword','Suggestion'])
  #shared keywords with date update
  commonSuggestion_df = pd.DataFrame(suggestionCommon_list, columns=['last_seen','Keyword','Suggestion'])
  merge=pd.merge(suggestion_df, commonSuggestion_df, left_on=["Suggestion"], right_on=["Suggestion"], how='left')
  merge = merge.rename(columns={'last_seen_y': 'last_seen',"Keyword_x":"Keyword"})
  merge["last_seen"].fillna(merge["last_seen_x"], inplace=True)
  del merge["last_seen_x"]
  del merge["Keyword_y"]
  
  #merge old results with new results
  frames = [merge, newSuggestion_df]
  keywords_df = pd.concat(frames, ignore_index=True, sort=False)
  # Save dataframe as a CSV file
  keywords_df['first_seen'] = pd.to_datetime(keywords_df['first_seen'])
  keywords_df = keywords_df.sort_values(by=['first_seen','Keyword'], ascending=[False,False])  
  keywords_df['first_seen']= pd.to_datetime(keywords_df['first_seen'])
  keywords_df['last_seen']= pd.to_datetime(keywords_df['last_seen'])
  keywords_df['is_new'] = (keywords_df['first_seen']== keywords_df['last_seen'])
  keywords_df=keywords_df[['first_seen','last_seen','Keyword','Suggestion','is_new']]
  keywords_df.to_csv('keyword_suggestions.csv', index=False)

# If you use more than 50 seed keywords you should slow down your requests - otherwise google is blocking the script
# If you have thousands of seed keywords use e.g. WAIT_TIME = 1 and MAX_WORKERS = 5
WAIT_TIME = 0.2
MAX_WORKERS = 20
# set the autocomplete language
LANGUAGE = "en"
# set the autocomplete country code - DE, US, TR, GR, etc..
COUNTRY="US"
# Keyword_seed csv file name. One column csv file.
#csv_fileName="keyword_seeds.csv"
CSV_FILE_NAME="keywords.csv"
autocomplete(CSV_FILE_NAME)
#The result will save in keyword_suggestions.csv csv file

Descarga o script Python

¿Que pensas?

Este sitio usa Akismet para reducir o spam. Aprende a procesar os teus datos de comentarios.