どもベーリラです。
仕事柄pythonを使ったりしています。
最近はAIを仕事でつかえるようになりました。
今回はブログ運営で使えそうなSEO対策です。
ブログ運営していくにあたって、SEOは重要となります。
この記事ではpythonを使うことで
ある検索キーワードの1~10位の「タイトル」「h1~h3タグ」が収集できる
つまり
うまく活用すれば上位を狙える!
といった形で活用できるかと思います。
【SEO対策】Pythonで検索キーワード ”アドセンス”、”合格” で1~10位を収集してみた。
次のサイトを参考にPythonを使って1~10位までの検索結果によるタイトルを収集してみました。
好奇心倶楽部
SEO対策はとてもめんどくさいです。 何がめんどくさいって調査がとてもめんどくさい。例えば内部リンクを整えようと考えても…
私はこのようにしました。
※Googleの仕様変更により修正が必要な場合があるためご注意ください!
#Googleの検索結果から上位サイトのtitle、h1、h2、h3、記事文字数を取得し、スプレッドシートへ出力 import sys import requests import bs4 import urllib.parse import datetime import csv #置換用 def replace_n(str_data): return str_data.replace('\n', '').replace('\r', '') #文字列用 def concat_list(list_data): str_data = '' for j in range(len(list_data)): str_data = str_data + replace_n(list_data[j].getText()).strip() + '\n' return str_data.rstrip("\n") #出力データ output_data = [] #列名 columns = ['検索順位', 'url', 'titleタグ', 'h1タグ', 'h2タグ', 'h3タグ', '記事文字数'] output_data.append(columns) #キーワードの指定 list_keyword = ['アドセンス', '合格'] #検索順位取得処理 if list_keyword: #Google検索の実施 search_url = 'https://www.google.co.jp/search?hl=ja&num=100&q=' + ' '.join(list_keyword) res_google = requests.get(search_url) res_google.raise_for_status() #BeautifulSoupで掲載サイトのURLを取得 bs4_google = bs4.BeautifulSoup(res_google.text, 'html.parser') #print(bs4_google.prettify()) #Googleの仕様変更により修正が必要な場合がある 動く方を使用 link_google = bs4_google.select('.kCrYT > a') #link_google = bs4_google.select('div.kCrYT>a') for i in range(len(link_google)): #なんか変な文字が入るので除く site_url = link_google[i].get('href').split('&sa=U&')[0].replace('/url?q=', '') #URLに日本語が含まれている場合、エンコードされているのでデコードする site_url = urllib.parse.unquote(urllib.parse.unquote(site_url)) if 'https://' in site_url or 'http://' in site_url: #サイトの内容を解析 try: res_site = requests.get(site_url) res_site.encoding = 'utf-8' except: continue bs4_site = bs4.BeautifulSoup(res_site.text, 'html.parser') #データを初期化 title_site = '' h1_site = '' h2_site = '' h3_site = '' mojisu_site = 0 #データを取得 if bs4_site.select('title'): title_site = replace_n(bs4_site.select('title')[0].getText()) if bs4_site.select('h1'): h1_site = concat_list(bs4_site.select('h1')) if bs4_site.select('h2'): h2_site = concat_list(bs4_site.select('h2')) if bs4_site.select('h3'): h3_site = concat_list(bs4_site.select('h3')) if bs4_site.select('body'): mojisu_site = len(bs4_site.select('body')[0].getText()) #データをリストに入れておく output_data_new = i+1, site_url, title_site, h1_site, h2_site, h3_site, mojisu_site output_data.append(output_data_new) #CSVファイルに出力する now = datetime.datetime.now() out = r"C:\Users\starw\OneDrive\デスクトップ\新しいフォルダー\123.csv" csv_file = open(out, 'w', encoding='UTF-8') csv_writer = csv.writer(csv_file, lineterminator='\n') for j in range(len(output_data)): csv_writer.writerow(output_data[j]) csv_file.close() print("END")
収集日:2020年9月26日
検索キーワード ”アドセンス” ”合格” で検索した結果を下に示しています。
本当は100位まで抽出したのですがとりあえず1~10位まで表示します。(あまりgoogle的によろしくなさそうでしたら即削除します。)
titleタグからSEOの参考になると幸いです^^
検索キーワード ”アドセンス” ”合格” 1位〜10位までの結果
このように「タイトル」と「h1」タグが表示されています。
この中で共通するキーワードがあれば、それを使うことで検索上位をねらえる
検索順位 | titleタグ | h1タグ |
1 | 【2020年版】Googleアドセンス審査のポイントと申請方法を詳しく解説 | 初心者のためのブログ始め方講座 | 【2020年版】Googleアドセンス審査のポイントと申請方法を詳しく解説 |
2 | 【2020年最新版】アドセンスとは?審査に合格する重要なポイントを解説!|Enazeal Engineer BLOG | 【2020年最新版】アドセンスとは?審査に合格する重要なポイントを解説! |
3 | アドセンス合格へのアドバイスをお願いいたします – AdSense Community | |
4 | Googleアドセンスに一発合格!7つの審査基準と対策法まとめ | Tekito style.me | Googleアドセンスに一発合格!7つの審査基準と対策法まとめ |
5 | 【2020最新版】Googleアドセンスの審査に通る5つのコツ!|資金調達プロ | 【2020最新版】Googleアドセンスの審査に通る5つのコツ! |
7 | Googleアドセンスに合格するまでにした7つのこと | NICHIMASU MARKET | Googleアドセンスに合格するまでにした7つのこと |
8 | Googleアドセンス審査に通過する方法【10のチェックリスト付き】 | Tsuzuki Blog | Googleアドセンス審査に通過する方法【10のチェックリスト付き】 |
9 | 403 Forbidden | 403 Forbidden |
10 | グーグルアドセンス審査合格時のサイト状況【画像は意味なし?】 | | グーグルアドセンス審査合格時のサイト状況【画像は意味なし?】 |
pythonでこんな感じで分析して活用できますよ♪
pythonを使ってみたいっていう方はインストールから始めましょう♪
pythonのインストール方法はこちらから↓
関連記事
python というプログラムやってみたい & 始めようと考えている人は 「pythonというプログラミングをやってみたいんだけど、どこから手を付ければいいのかわからない。頑張ってみる気はあるから、誰か教えてー!」 とな[…]