株式会社ホクソエムのブログ

R, Python, データ分析, 機械学習

GitHub Actions実行時に依存するRパッケージのインストールをキャッシュ化する

R

ホクソエムの u_ribo です。漫画「ブリーチ」の石田雨竜に親近感を感じます。仕事はシュッと終わらせて趣味の時間を増やしたいですよね。 要約 GitHub Actionsに対してrenvを使ったキャッシュ機能を活用。依存するRパッケージのインストール時間を短縮する …

Rでのナウなデータ分割のやり方: rsampleパッケージによる交差検証

R

前処理大全の「分割」の章では、予測モデルの評価のためのデータセット分割方法が解説されています。基礎から時系列データへ適用する際の注意まで説明されているだけでなく、awesomeなコードの例がRおよびPythonで書かれており、実践的な側面もあります(お…

データ分析のワークフローをdrakeで管理して効率的に作業を進めよう

要約 drakeパッケージは、GNU makeのようにあらかじめ定義されたワークフローを自動的に実施する仕組みを、Rユーザに馴染みやすいデータフレーム形式で提供する ワークフローの構築と管理、実行はRの関数として提供され、依存関係を可視化する関数も用意され…

モデルで扱うデータの前処理をrecipesで行う

R

ドーモ。ホクソエムの @u_ribo です。本業ではモデリングとは離れたギョームをしています。寂しくなったので、Rのrecipesパッケージについて紹介します。 tidymodels.github.io モデルに適用するデータの前処理 Rでのモデル式 (model formula) の記述って、…

awe.s3パッケージでRからのAWS S3とのファイルやりとりを行う

ドーモ。ホクソエムです。更新が久しくなってしまいました。ホクソエムでは現在、Amazon Web Service (AWS)を利用していないのですが、本職の方でS3に触れる機会があったので、RからS3への操作を行うためのパッケージ awe.s3 を紹介したいと思います。 ASW S…

RStudioアドイン 10選

Rユーザのみなさん、RStudio使っていますか。RStudioを使うなら、RStudioアドインも使いましょう。便利です。 … でも、\どんなアドインがあるのかわからない!/ という声をしばしば聞きます。というわけでお気に入りのアドインを10個まとめました。用途ご…

ナウでヤングなRの環境変数管理方法

こんにちは。ホクソエムのグローバル推進事業部にて本部長を努めます瓜生(@u_ribo)です。この記事ではRにおける環境変数の設定方法のおさらいと、ナウな手法を使った環境変数の管理方法について紹介します。 環境変数を利用していますか? Rでは、利用してい…

2017年4月1日、ドイツのRユーザ @henningswayが東京へやって来るということで、Global Tokyo.R#2が開催されました。ホクソエム各位も運営や発表を行いました!!というわけで今回の記事はGlobal Tokyo.Rの参加レポートとなります。 Contents Presenter Slide N…