スキップしてメイン コンテンツに移動

投稿

ラベル(NoSQL)が付いた投稿を表示しています

Apache-Drillを利用してData Scientistになろう!初級編!

何も知らない人のための講座になります。 まずはApache Drillをインストールしましょう。 https://drill.apache.org/ Apache Drillを自分のパソコンにインストールしましょう! 下記のファイルをまずダウンロード! ダウンロード: https://drill.apache.org/download/ JDKが要ります: https://www.oracle.com/java/technologies/javase-jdk8-downloads.html もしUnzipが必要なら: https://www.7-zip.org/download.html インストールマニュアル: https://drill.apache.org/docs/installing-drill-on-windows/ インストール時チェック事項 ・JAVA_HOME設定しました? ・Drill UDFフォルダを作成しました? ・Drill UDFフォルダに権限を与えました? ではダウンロードしたDrillを起動しましょう! 圧縮を解凍するとフォルダができます。 apachi-drill-..... この中にbinフォルダに入ります。 apache-drill-embedded.bat を実行します。 しばらく待ったらプロンプトが出ます。 apache drill> と表示されたらOKです! プロンプトでもSQLの実行ができますが 見やすいWebUIを提供してくれるので ブラウザを立ち上げます。 localhost:8047 に接続すると 何か出ました! Queryをクリックしましょう。 Queryを入力する画面に早速自分のデータを入れてみましょう! UTF-8で保存したCSVファイルを用意しましょう。 今回はtest01.csvと名付けました select  *  from  dfs. `C: \l wwork \t est01.csv`   limit   10 ; と入力して実行!(ctrl + enter) CSVデータがウェブ上に表示されたら成功です! ここでいくつかのTipをだすと、 基本的にCSVのフィールド名は無