株式会社ホクソエムのブログ

R, Python, データ分析, 機械学習

書籍「評価指標入門」の出版に寄せて 〜監修の想い(O・MO・I)

監修させていただいている評価指標入門なんですが、株式会社ホクソエムの代表取締役CEOである私、牧山幸史(以下、コージー牧山)、はじめてこの企画を聞いた時は「その特徴は単に評価指標をまとめた辞書やないかい!そういう”売れそうだから書く”みたいな商…

ggplot2 で facet ごとのヒストグラムに平均値の線を引く

ggplot2 で facet ごとのヒストグラムに平均値の線を引きたい。 例えば次のような感じ。 Rコミュニティの Slack である r-wakalang で聞いたところ、即回答がもらえただけでなく、いろいろなやり方を教わったのでメモしておく。 みなさんありがとう。 基本作…

ggplot2 で時系列プロットの端点にラベルを表示する

こういう感じで時系列プロットの端点にラベルを表示したい。 この方が時系列とラベルの対応がわかりやすくて良い。 データ視覚化のデザイン #1|Go Ando / THE GUILD|note ggrepel パッケージを使うと簡単にできるが、いくつか注意点があるのでここで紹介し…

【2018年版】R でハッシュテーブルの速度比較

以前、こういう記事を書いた。 R でハッシュテーブルの速度比較 #rstatsj Rでハッシュテーブルを使う方法はいくつかあるが、 サイズが 1000 以下ならば名前付きベクトルが速い それ以上なら環境を使った方法が速い hash パッケージは遅いが記述がわかりやす…

ggplot2 で時系列の区間に影をつけるのは annotate が便利ぽい

例えば次のような時系列データがあるとします。 library(xts) ts <- as.xts(Nile) library(ggplot2) autoplot(ts) このプロットの 1900年から1940年までの区間に影をつけたい。 これには annotate() が便利ぽい。 autoplot(ts) + annotate("rect", xmin = as…

RStudioServer から ShinyApp を直接デプロイしたい

現在 CentOS 7.5 サーバーに RStudioServer と ShinyServer を入れて RStuidio 上で ShinyApp を書いています。 デプロイするには /srv/shiny-server/ の下にフォルダを丸ごとコピーしていますが、サーバにいちいちログインするか RStudio の新機能である Te…

R の強制型変換と NA の取り扱い

はじめに R において欠損値を表す NA は非常に便利です。 NA は普通の R ユーザにとって自然に取り扱うことのできる概念ですが、それを支える内部の仕組みはわりと複雑です。 例えば、NA の型は論理値型ですが、一体それはなぜでしょうか? 今日は R におけ…