ワイヤード・パンチ

サイトタイトル変えたい…。もうメカメカしいの関係なくなった…。

ブログからアクセス数が0の記事を抽出する方法。

開設してから3年3ヶ月近くたった当サイト、記事の数は現時点で573件ありました。(この記事含めず)

しかし、全く読まれていない記事も多数あり、ゴミ記事は削除したほうがGoogleからのサイト評価が上がり、ユーザへの利便性にもつながるとよく言われています。

それを置いといても、自分でも読み返したくない記事にあふれており、気持ちの整理をつけるためにも、ゴミ記事の削除を考えています。

広告

ゴミ記事の判別方法。

とにかく、自分でもう読み返したくないと思う記事はゴミ記事で間違いないのですが、先程も書いたように、当サイトにはすでに記事が500件以上存在します。

たとえば、書いてたそのときは非常に気が荒れていて、世間への不満をぶちまけたような記事とか。

私の場合、昔は大阪の大都会住みで、仕事もプログラマーで、本当に心休まるときがないような生活でしたので、そんなときに書いた記事が面白いわけがありません。

あと、身の上話なんてしたところで、書いてる人間がタレントかなんかじゃないと、まず興味持ってもらえないですね…。

ただ、自分でもどんな記事を書いていたか覚えていないと、ひとつひとつゴミかどうかを判断するのは、非常に骨が折れます。

また、アクセス数のほとんどない記事は、Google検索にすらひっかからない、検索キーワードを全く意識していないということで、これもゴミ記事と言えるでしょう。

アナリティクスで過去30日間のデータを調べて、書いてからだいぶ経つのに、1日のアクセス数がたった1桁の記事とか。

しかし、アナリティクスで検出できるのは、最低でもアクセスが1以上だった記事のみ。

本当にアクセスが全くない、アクセス数が0の記事だった場合はアナリティクスに検出されないので、見逃してしまう恐れがあります。

というわけで今回は、アクセス数が0だった記事を抽出する方法を解説いたします。

下準備。

アナリティクスの結果の他に、ブログに存在する記事のURL一覧が必要になります。

全記事のURLとアナリティクスの結果を比較して、アナリティクスにないものがアクセス0だと判断するためです。

今回の場合、Wordpressのプラグイン、All in One SEOで生成したsitemap.xmlから全記事一覧を出力することにします。

また、ExcelやGoogleスプレッドシートなどの表計算アプリも必要になりますが、今回はLibreOfficeを使用します。

全URL一覧の出力。

まずはsitemap.xmlへアクセスしましょう。

当サイトの場合、URLは下記になります。

https://wiredpunch.com/sitemap.xml

sitemap.xmlを開いたら、表の部分をすべてマウスドラッグで囲って、コピーします。

コピーしたら表計算ソフトに貼り付けます。

ただ、このままだとURLがフルパスになっており、相対パスであるアナリティクスとの比較ができません。

よって、まずA列をクリックして列選択します。

列選択された状態でCtrl+Hを押し、置き換えウインドウを開きます。

ドメインの部分だけ空になるように置き換えを実行しましょう。

置き換えを実行後、タイトル行である1行目と、B列以降を削除して、ひとまずこれの準備はOKです。

アナリティクスの結果一覧の出力。

アナリティクスの結果はcsvとして出力することができるので、先程の全記事一覧と比較するために作成することにします。

まずはアナリティクスを開いて、行動→サイトコンテンツ→ディレクトリへ進みます。

WordPressのAMPプラグインでampページを生成している場合、他のビューだと通常ページとampページが別々に計測されてしまいます。

でもディレクトリまで進んでおけば、ampページも合算された状態で計測できます。

また今回は、計測の期間は過去30日に切り替えしておきます。

このままだと10件しか表示されておらず、csv出力しても10件分しか出てきません。

よって、一番下までスクロールして、表示する行数の値を大きくします。

今回は全部で562件だったのですが、プルダウンから値を選ぶ形式だったので、1000件を選択しておきます。

そして行数を切り替え後、ページ右上にあるエクスポートをクリックして、csvを出力します。

csvを開いて、タイトル行である1~7行目と、B列以降を削除して、これもいったん準備完了です。

アナリティクスになかったURLを抽出する。

表計算の新しいファイルを開いて、sitemap.xmlとアナリティクスから抽出した一覧を、左右の列に貼り付けしましょう。

今回は、sitemap.xmlから抽出したものをA列、アナリティクスから抽出したものをD列に貼り付けました。

【エクセル初心者向け】データの照合・突合・比較をする方法

次に、上記のサイトを参考し、B1に条件式のセルを作成します。

=countif($D$1:$D$1000,A1)

上記の式の場合は、A1の値が、D1からD1000に含まれているかどうかの式となります。

セルの編集を確定すると、含まれていれば1、含まれていなければ0が表示されます。

他のURLも調べるため、B1クリック時にセルの右下にある黒い点を、マウスドラッグで最終行まで広げます。

すると、最終行まで同様の条件式が自動で作成されます。

結果を見ていくと、セルの値が0になっているものがありました。

A列はすべての記事のURLが入った列であり、D列はアナリティクスで1件以上のヒットがあった記事のURL。

つまり、0が表示されると全くアクセスのなかった記事ということになります。

よって、よほど思い入れのある記事でなければ、ゴミ記事と判断してもいいでしょう。

このままだと1と0のものがバラバラの場所に存在しているので、B列を昇順並び替えして、0のものが上に来るようにするとわかりやすくなります。

余談。

最近は何かと、量より質と言われます。

それに、消したくなるくらいなら初めから書くなと思う人も居るかもしれません。

でも、実際に書いてみなければ、ウケるかどうかわかりません。

いきなり高品質な記事なんて書けませんし、まだブログを始めて間もないのであれば、ひとまず記事を溜めましょう。

その記事がいらないかどうかは、あとから判断すればいいこと。