SQL And Python (Again)
近所の席の同僚が内製の dashboarding tool をつかい複数のタブからを SQL を叩きつつにらめっこしていたので、そういうのは Colab の方がいいよ、と勧めたところ(この同僚は他の用途に Colab を使っていたため敷居はさほど高くない) 「いやーでも histogram どう描くのかわからないんだよねー」という。「ちょっと Python 足せばいいじゃん」「めんどくさい」などの会話がつづき、そうかそうか・・・とおもって帰宅したら、翌朝チームに送られてきたメールは colab をリンクしており、matplotlib でヒストグラムを書いていた。やるな。
自分は以前 SQL で histogram を計算したのち Pandas で plot をしてめんどくせーとかいっていたが、彼のコードをみると SQL は結果をひっぱってくるのみで histogram は Python 側で計算していた。データサイズをみるとたしかに全然大丈夫そう。SQL でヒストグラムはすごいめんどっちいので、この手の作業は Python でできるならその方がいいね。心を改めた。というかデータがでかいならサンプリングすればいいだけだから、基本的に histogram は Python の方が良さそう。