【SEO対策】Pythonで検索キーワード ”アドセンス”、”合格” で1~10位を収集してみた。

  • 2020年9月27日
  • 2021年1月10日
  • python

どもベーリラです。

仕事柄pythonを使ったりしています。

最近はAIを仕事でつかえるようになりました。

今回はブログ運営で使えそうなSEO対策です。

ブログ運営していくにあたって、SEOは重要となります。

この記事ではpythonを使うことで

ある検索キーワードの1~10位の「タイトル」「h1~h3タグ」が収集できる

つまり

うまく活用すれば上位を狙える!

といった形で活用できるかと思います。

【SEO対策】Pythonで検索キーワード ”アドセンス”、”合格” で1~10位を収集してみた。

次のサイトを参考にPythonを使って1~10位までの検索結果によるタイトルを収集してみました。

好奇心倶楽部

SEO対策はとてもめんどくさいです。 何がめんどくさいって調査がとてもめんどくさい。例えば内部リンクを整えようと考えても…

 

私はこのようにしました。

※Googleの仕様変更により修正が必要な場合があるためご注意ください!

#Googleの検索結果から上位サイトのtitle、h1、h2、h3、記事文字数を取得し、スプレッドシートへ出力
import sys
import requests
import bs4
import urllib.parse
import datetime
import csv
#置換用
def replace_n(str_data):
    return str_data.replace('\n', '').replace('\r', '')
#文字列用
def concat_list(list_data):
    str_data = ''
    for j in range(len(list_data)):
        str_data = str_data + replace_n(list_data[j].getText()).strip() + '\n'
    return str_data.rstrip("\n")
#出力データ
output_data = []
#列名
columns = ['検索順位', 'url', 'titleタグ', 'h1タグ', 'h2タグ', 'h3タグ', '記事文字数']
output_data.append(columns)
#キーワードの指定
list_keyword = ['アドセンス', '合格']
#検索順位取得処理
if list_keyword:
    #Google検索の実施
    search_url = 'https://www.google.co.jp/search?hl=ja&num=100&q=' + ' '.join(list_keyword)
    res_google = requests.get(search_url)
    res_google.raise_for_status()
    #BeautifulSoupで掲載サイトのURLを取得
    bs4_google = bs4.BeautifulSoup(res_google.text, 'html.parser')
    #print(bs4_google.prettify())    
    #Googleの仕様変更により修正が必要な場合がある 動く方を使用
    link_google = bs4_google.select('.kCrYT > a')    
    #link_google = bs4_google.select('div.kCrYT>a')     
    for i in range(len(link_google)):
        #なんか変な文字が入るので除く
        site_url = link_google[i].get('href').split('&sa=U&')[0].replace('/url?q=', '')
        #URLに日本語が含まれている場合、エンコードされているのでデコードする
        site_url = urllib.parse.unquote(urllib.parse.unquote(site_url))        
        if 'https://' in site_url or 'http://' in site_url:
            #サイトの内容を解析
            try:
                res_site = requests.get(site_url)
                res_site.encoding = 'utf-8'
            except:
              continue
            bs4_site = bs4.BeautifulSoup(res_site.text, 'html.parser')   
            #データを初期化
            title_site = ''
            h1_site = ''
            h2_site = ''
            h3_site = ''
            mojisu_site = 0
            #データを取得
            if bs4_site.select('title'):
                title_site = replace_n(bs4_site.select('title')[0].getText())
            if bs4_site.select('h1'):
                h1_site = concat_list(bs4_site.select('h1'))
            if bs4_site.select('h2'):
                h2_site = concat_list(bs4_site.select('h2'))
            if bs4_site.select('h3'):
                h3_site = concat_list(bs4_site.select('h3'))
            if bs4_site.select('body'):
                mojisu_site = len(bs4_site.select('body')[0].getText())
            #データをリストに入れておく
            output_data_new = i+1, site_url, title_site, h1_site, h2_site, h3_site, mojisu_site
            output_data.append(output_data_new)
#CSVファイルに出力する
now = datetime.datetime.now()
out = r"C:\Users\starw\OneDrive\デスクトップ\新しいフォルダー\123.csv"
csv_file = open(out, 'w', encoding='UTF-8')
csv_writer = csv.writer(csv_file, lineterminator='\n')
for j in range(len(output_data)):
    csv_writer.writerow(output_data[j])
csv_file.close()
print("END")

 

収集日:2020年9月26日

検索キーワード ”アドセンス” ”合格” で検索した結果を下に示しています。

本当は100位まで抽出したのですがとりあえず1~10位まで表示します。(あまりgoogle的によろしくなさそうでしたら即削除します。)

titleタグからSEOの参考になると幸いです^^

 

検索キーワード ”アドセンス” ”合格” 1位〜10位までの結果

このように「タイトル」と「h1」タグが表示されています。

この中で共通するキーワードがあれば、それを使うことで検索上位をねらえる

検索順位 titleタグ h1タグ
1 【2020年版】Googleアドセンス審査のポイントと申請方法を詳しく解説 | 初心者のためのブログ始め方講座 【2020年版】Googleアドセンス審査のポイントと申請方法を詳しく解説
2 【2020年最新版】アドセンスとは?審査に合格する重要なポイントを解説!|Enazeal Engineer BLOG 【2020年最新版】アドセンスとは?審査に合格する重要なポイントを解説!
3 アドセンス合格へのアドバイスをお願いいたします – AdSense Community
4 Googleアドセンスに一発合格!7つの審査基準と対策法まとめ | Tekito style.me Googleアドセンスに一発合格!7つの審査基準と対策法まとめ
5 【2020最新版】Googleアドセンスの審査に通る5つのコツ!|資金調達プロ 【2020最新版】Googleアドセンスの審査に通る5つのコツ!
7 Googleアドセンスに合格するまでにした7つのこと | NICHIMASU MARKET Googleアドセンスに合格するまでにした7つのこと
8 Googleアドセンス審査に通過する方法【10のチェックリスト付き】 | Tsuzuki Blog Googleアドセンス審査に通過する方法【10のチェックリスト付き】
9 403 Forbidden 403 Forbidden
10 グーグルアドセンス審査合格時のサイト状況【画像は意味なし?】 | グーグルアドセンス審査合格時のサイト状況【画像は意味なし?】

 

pythonでこんな感じで分析して活用できますよ♪

pythonを使ってみたいっていう方はインストールから始めましょう♪

pythonのインストール方法はこちらから↓

関連記事

python というプログラムやってみたい & 始めようと考えている人は 「pythonというプログラミングをやってみたいんだけど、どこから手を付ければいいのかわからない。頑張ってみる気はあるから、誰か教えてー!」 とな[…]

最新情報をチェックしよう!