Pythonで、pandasのDataFrameの複数列の文字列を結合する方法を2つご紹介します。 ラベル「Pref」「City」「Town」の列の文字列を結合します。 出力結果は下記です。 戻り値は、Series型です。 出力結果は下記です。 こちらも戻り値は、Series型です。 2.データ内に ...
こんにちは。新卒3年目のKです。 厳密な定義は一旦置き、本記事で使用するメモリエラーの定義は、「プロセスに割り当てられたメモリ(RAM)の残容量を超えるメモリ使用があった際に起こるエラー(PythonではMemoryErrorと表記)」とします。 メモリエラーの ...
次にCSVファイルをPythonで読み込んで、中身のデータを確認していきます。分析するのは前回の記事でも使ったコンビニエンスストアの売り上げと関連情報をまとめたデータ「sales_data.csv」です。 今回の分析に利用するデータの中身。コンビニエンスストアの ...
データ分析に用いられるプログラミング言語は、本連載の前回記事で紹介した「R」以外にもいろいろあります。そのなかで、今回は初心者でも学びやすく汎用性の高いプログラミング言語「Python」を使ったデータ分析の概要を見ていきましょう。Pythonの特徴 ...
門脇@satoru_kadowakiです。今月のPython Monthly Topicsでは、Rust製の高速データフレームライブラリ Polarsについて紹介します。 Polarsとは Pythonでデータ分析に使用される主なライブラリに pandasがあります。Polarsはpandasと同様にデータフレームというデータ構造 ...
会員(無料)になると、いいね!でマイページに保存できます。 上記以外に、機械学習を実装するときに使うPythonのオープンソースのライブラリもあります。代表的なものがscikit-learnです。 scikit-learnは開発が活発に行われているため、改善が高速に進み ...
NECは2023年10月19日、Python用データ分析ライブラリ「pandas」を高速化するソフトウェア「FireDucks」ベータ版の無料公開を開始した。使い勝手はpandasと同じで、実行時コンパイルによってデータの前処理を高速化する。TPCx-BBベンチマークテストで、pandasと比べて ...