バイオインフォマティクスをこれから始める人のためのコマンドライン講習会

Linux/Mac コマンドライン講習会'16


コマンドライン講習会

バイオインフォマティクスをこれからはじめる超初心者向けに Linux/Mac のコマンドラインの使い方を学ぶハンズオンの講習会を開催します。

東京大学大学院新領域創成科学研究科・文部科学省研究費新学術領域研究『生命科学系3分野支援活動』共催

はじめに

 超並列DNAシークエンサーの登場など、生物学ではハイスループットな測定装置の登場が相次いでいます。 生物学では Excel では扱えないサイズの「ビッグ」データを解析しなければ研究にならない分野がどんどん増えています。 しかし、物理学などの分野と比べると生物学はコンピューターの取り扱い経験が比較的少ない人も多く、 Linux や Mac のコマンドラインの知識を必要とするバイオインフォマティクスを独学で進めるのは難しい状況でした。 そこで、個々の解析ツールのレビュー記事や blog などを読んで実践できる程度の基礎知識を付ける講習会を企画しました。

講習会の対象者

 大学の学部生・大学院生でバイオインフォマティクス(NGS などのゲノム解析を念頭に置いています)の解析をこれから、あるいは近い将来はじめるつもりの学生がメインターゲットですが、会場のキャパシティが許す限りそれ以外の一般参加も可能です。 また、前提知識ゼロの方を対象にしていますので、既にある程度使いこなしている人にはつまらないぐらいの内容になると思います。

日時・開催場所

日時
2016年3月28日 13:00~18:00
2016年3月29日 10:00~16:00(昼食休憩含む)
場所
東京大学 柏キャンパス 情報生命科学実験棟2F 講義室
最大人数
会場のキャパシティは35名です。3/25 13:00 時点で10名枠が余っていますので、申し込みの先着順とします。
当日参加枠
当日参加を5名まで受け付けます(3/27 13:00 追記)。ただし、当日参加者にはノートパソコンのレンタルはありません。

参加費

無料です。欠席する場合には必ずご連絡下さい。

参加申し込み

参加申し込みをするにはこちらから必要事項を記入下さい。

事前参加申し込みは締め切りました。少数ながら当日参加枠もあります。

本講習会の目標

具体的な個別の解析ソフトウェアの使い方等ではなく、一般的な Linux/Mac のコマンドライン操作の基本知識を身につけることを目的にする。 研究室内のワークステーション、あるいは大型スーパーコンピューターのアカウントを貰った学生等が、 個別の解析ソフトウェアの知識をだけを追加で学べばゲノム解析をすぐに実施できるようになるレベルを目標とする。 よって、管理者側(root)の知識は今回はほとんど含めない。 また、本来であれば1週間程度欲しい内容であるためカリキュラム最後の方は終わらない可能性もあることに注意。

持ってくるもの

  1. Linux か Mac OS X を搭載したノートパソコン。
    東京大学の学部生・大学院生に対しては Mac Book Air の貸し出しが可能ですので申し込んで下さい(最大15名)。
    電源アダプターも忘れずに。
    Windows ノートパソコンしか持っておらず Mac Book Air の貸し出し対象にならない方々向けに Windows 上に Linux 環境を構築するチュートリアルも同時開催します。詳しくはこのページ遙か下方にある関連項をご覧下さい。
  2. 東京大学の関係者は有線LANのアダプターを持参することが望ましい。
  3. 有線LANを使わない場合には無線LAN内蔵のノートパソコンを持ってくること。その際、学内者は UT-roam のアカウント(学内共通無線LANアカウント)を予め取得してくること。
  4. 最寄りのコンビニまでは往復10分以上かかるため、ペットボトルなど蓋のできる飲み物を持ってくると良いでしょう。

カリキュラム(予定)

  • CUI の概念
  • キーボードの上にあるキーの読み方と入力方法
  • ファイルシステムの概念
    • ファイルシステムの階層構造
    • シンボリックリンクとハードリンク
    • パーミッション
    • クォータ
    • テキストファイルとバイナリファイルの違い
    • 遠隔のファイルシステム
  • テキストエディタを使ってみよう
  • 基本的なUNIXコマンド
    • ls, rm, cp, mv, cd, mkdir, rmdir, pwd, chmod, cat, cut, sort, uniq
    • wc, tar, grep, ps, kill, gzip, wget, curl, head, tail, less, diff
    • diff, find, df, du, top, ssh, scp, rsync, echo, man など多数
  • シェルとターミナルの基本
    • ワイルドカード
    • エスケープ文字とクオーテーション
    • パイプとリダイレクト、バッククオート
    • 標準入力と標準出力、標準エラー出力
    • 環境変数(とシェル変数)
    • 簡単な for ループぐらい
    • ジョブ管理
    • コマンドライン補完
    • ターミナルのフローコントロール
  • シェルスクリプト
    • スタートアップスクリプトと設定
    • 環境変数
    • よく使われる環境変数(PATH, LD_LIBRARY_PATH など)
  • ワンライナーで簡単な処理をしてみよう
    • 改行コードを変換してみよう
    • 他の例題は作成中
  • 困ったときに調べる方法
  • より高度な話題(時間が余った場合に取り組みます)
    • ソフトウェアのインストール
    • tmux を用いたスクリーン管理
    • zsh の紹介
    • GUI との連携コマンド群(open, pbcopy など)
    • vim/emacs の紹介

Windows搭載のノートパソコンしか持っていない場合

バイオインフォマティクス(主にゲノム解析を想定しています)において Windows 環境のみで研究をするには高いスキルが必要で、かつ大変な苦痛が伴います。

というわけで、本来であれば万難を排して MacBook などを購入するべきですが、講習会の日にはまだ購入できていないという人のために Windows ノートパソコン上に VirtualBox という仮想環境構築ソフトを用いて Linux をインストールするハンズオンチュートリアルを実施します。

初日(3月28日)の10:30より同じ場所での開催となりますので申し込みの際にお知らせ下さい。

その他

宿泊の斡旋や交通費の補助はありません。移動手段はご自分で確保ください。また、宿泊する場合にはJR柏駅前かつくばエクスプレス線の柏の葉キャンパス駅前に泊まる方が多いようです。

聞かれそうな質問

    Q.コマンドラインの基礎だけでは無くてゲノム解析の個別ソフトウェア解説もしてください。
    A.今回は明らかに時間が足りないのでやりません。今後の開催については検討しています。
    Q.言語は日本語ですか?
    A.質問は英語でしてもらっても構いませんが解説は全て日本語です。
    Q.資料等は公開されますか?
    A.全部録画して後ほど公開する予定です。
    Q.卒業済みの学部4年生は学生扱いですか?
    A.3月1日付けの身分でお願いします。
    Q.自分は参加枠に収まっていますか?
    A.開催2日前ぐらいに当落をメールします。
    Q.部分参加は可能ですか?
    A.可能です。その場合には申込時の備考欄に参加日程をお書き下さい。また、フル参加の方より参加優先順位を落としますので予めご了承下さい。

その他

お問い合わせは mkasa@cb。k.u-tokyo.ac.jp (笠原雅弘)までお願いします。(表示されているメールアドレスは宛先に直接コピー&ペーストすると無効なアドレスになりますので気をつけて下さい。)