俺のOneNote

俺のOneNote

データ分析が仕事な人のOneNote愛とか、分析小話とか。

本業の話

Numpyroでベイズ統計モデリング~単回帰モデル~

かれこれ数年付き合ってきたstan ですが、 推定の遅さが仕事上かなりネックになっており、 メインで使うPPLを高速にMCMCを回せるNumpyroに変えようと模索中。 以下、RとStanで始めるベイズ統計モデリングによるデータ分析入門のデータ&分析内容を題材に、Num…

同ディレクトリ内データ結合はExcelで超簡単にできることが全世界に広まってほしい

今日のお悩み あるディレクトリ内に、同じようなCSV・xlsxをたくさんつくって、後で結合しなきゃいけない とか 100個レイアウトが同じデータがあるんだけど結合作業が死ぬ とかで困ったことがある人は絶対いると思うんですが、 Excelで一発ですよ。 というお…

データアナリストを目指したい人のために個人的な道案内をしてみる

コロナ影響による陰りがありつつ、データサイエンス人気は依然として高そうです。 僕自身も、データサイエンス・データアナリティクスは引き続きビジネスにあたって、なくてはならない技術でありつづける気はしています。 (コレだけでは食っていけなくなる…

【随時更新】誰にも教えたくないBIダッシュボードデザインに便利なサイト集を晒す

デザイン・分析アイデア public.tableau.com powerbi.microsoft.com d3js.org www.storytellingwithdata.com datavizproject.com data-viz-lab.com From data to Viz | Find the graphic you need デザイン素材 icooon-mono.com free-line-design.com kage-d…

ネットワークグラフをつくるためのTableauとPython

Tableauでネットワークグラフを可視化しようとすると、座標データをどう用意するかが一番ネックになると思います。 現状、Tableau内でネットワークグラフを自動生成する機能は無さそうです。 ので、この辺の処理はPythonを噛ませると楽にできるので、ちゃん…

Python の progress bar いろいろ

プログレスバーなんてtqdm一択じゃね? という結論で落ち着く話ではありそうですが、 なんとなく、「もっとライブラリの種類あるのかなぁ?」と思って調べてみました。 環境はgoogle colabです。 tqdm たぶん誰もが使ったことがあるおなじみtqdm github.com …

IFTTTでGoogleスプレッドシートに接続、Tableau Publicで可視化、自動更新する

タイトルのとおり、今回のアーキテクチャはこんな感じです。 超シンプル! 自分のandroidの電源プラグ抜き差しの情報を IFTTT 経由で Googleスプレッドシート に流し、 さらに Tableau Public の Googleスプレッドシートコネクタで情報取得、Publicギャラリ…

pandasだけでWEBスクレイピングする

一般的にスクレイピングを使用とすると、requestsでHTMLなりjsonなりを拾ってくるのが一般的かと思われます。 Python, Requestsの使い方 | note.nkmk.me ただ、tableタグで構造化されている場合、pandasだけでデータを拾ってこれるので大変お手軽です。 例え…

Power BIとの出会いが人生を変えた話。

この記事は Microsoft Power BI Advent Calendar 2019の12/22 担当分です お話の要点 タイトルとおり、「Power BI」との出会いが僕の人生を変えた話。 ただのポエムなので、Qiitaでなくこちらに書きました。 新しい技術・知識の習得に取り組むのはいいぞ、と…

2019年の抱負をば。

皆様、新年あけましておめでとうございます。 昨年は、このブログを開設したり、MVP受賞したり、転職したり、引越ししたり、激動の1年となりました。 昨年をもろもろ振り返り、現在のスペックを記録し、今年1年の抱負でも書き残しておこうと思います。 1…

使わないと時代遅れ?BIが実現するデータ分析の高度化・民主化・効率化の話

データ分析の高度化・民主化・効率化 BIを活用する理由はこの3点に集約されるというのが私の考えです。 これらの言葉を聞いて少しでも関心を持ったら少しでもBIの利用・運用について試してみて損はないと思います。

Matplotlib アスペクト比の調整

Matplotlibでグラフ描写する際、アスペクト比でちょっとはまってしまったので覚書メモです。 グラフ描写準備 import numpy as np import matplotlib.pyplot as plt import seaborn as sns %matplotlib inline plt.style.use("ggplot") x = np.linspace(-3,3,…

はじめてのてんしょく

私事ではございますが、この度転職させていただくこととなりました。 本日が最終出勤日、10月16日から渋谷で働きます。 引越しなども伴う家族総出の大決断になってしまいました。 今後は、企画&ポイント事業会社さんでデータアナリストとして働きます。 …

Pythonコーディング・データ分析のお勉強方針メモ

QiitaにてPython×PowerBI記事を連載することにしました。 PowerBIはともかく、初心者の方はPythonの敷居がめちゃくちゃ高い方も多いのではないかと思います。 私自身、胸を張って書けると言えるレベルではないですが、 どのようにしたらPythonで楽しくコーデ…

Microsoft MVP - Data Platformを受賞しました!

2018年7月1日付けで、Microsoft MVPを受賞しました! カテゴリは Data Platform での受賞です! ・・・このブログでの報告はなんと紛らわしいw 本業のPowerBI関連の活動実績が認められました。 PowerBIに魅了されて約3年、色々な勉強と啓発の機会をいただ…

【第3回】Python Marketing Data Analytics! ~集計と検定~

さて、前回に引き続き、今回は集計・検定を実施してデータの理解をさらに深めたいと思います~。 ただし、データが大きいので、検定はあくまで方法論だけって感じですね。 集計 集計は、可視化と並び、データの基本的な傾向を把握するために必須といっていい…

【第2回】Python Marketing Data Analytics! ~データ確認の第一歩、可視化~

さて、前回に引き続き、銀行のキャンペーンマーケティングデータに基づく分析をネタにした勉強記録ですー。 データの可視化 まずは、データのheadを確認。 df.head() .dataframe tbody tr th:only-of-type { vertical-align: middle; } .dataframe tbody tr …

【第1回】Python Marketing Data Analytics! ~古典的マーケティングデータ分析にも目を向けて~

このカテゴリは本業、データ分析系のお話やTipsです。 Qiitaに書くレベルではない自分の覚書や練習記録、情報提供として残していこうかと。 qiita.com 1年後に「まだ自分はこの程度だったのか~wクソダサいww」というのが目標です。 つーかブログ趣旨とギ…