超高速grep「The Silver Searcher(ag)」からhighwayに乗り換えた
プログラマーにとって,grepコマンドはなくてはならない存在です。
基本的かつ古典的なユーティリティであるgrepですが,使いにくい面もあります。
2013年のはじめころから,grepに取って代わるコマンドとして「The Silver Searcher」(以下「ag」)が注目されはじめました。
そして最近、highwayというagライクで高速なgrepツールがリリースされました。
The Silver Searcher(ag)とは?
highwayの紹介の前にagとagが開発された背景について説明したいと思います。
プログラムを書いていると,ソースコード全域にわたって文字列を検索したい,ということはよくあります。
そのようなときにgrepコマンドが活躍するわけですが,ソースコードのディレクトリには検索したくないファイルが往々としてあるわけです。
たとえばバージョン管理システムが使っている「.git」ディレクトリは,検索対象に含めたくありません。
これをgrepで実現しようとすると,オプションやパイプを組み合わせて,少々面倒なワンライナーを書く必要があります。
こういった問題を解決するため,ackというプログラムが作られました。
ackは以下のような特徴を持つ,開発者向けの賢いgrepツールです。
- デフォルトでディレクトリツリーを再帰検索
- .gitなどを暗黙的に除外
- 検索するファイルタイプをオプションで指定可能(–perl,など)
- 拡張子だけでなく,shebangを見てファイルタイプを判別可能
- 検索結果をファイル単位でわかりやすくまとめて表示
ackはgrepと比べて使い勝手がよいのですが,Perlで実装されていることもあり,動作速度に難があります。
その動作速度の問題を改善するためにagが開発されました。
agは開発者が「A code searching tool similar to ack, with a focus on speed.」と紹介しているとおり,「高速なack」を目指して開発されたプログラムです。
「ackに比べて3から5倍高速」を謳っており,そして実際非常に高速です。
The Silver Searcher(ag)の問題点
紹介した通り、使い勝手がよく、性能もよいagなのですが、以下の問題点があります。
- EUC-JPやShift_JISなどの日本語に使われるマルチバイト文字列が検索できない
- 検索結果の出力順が検索する度に異なる
全てのコードがUTF-8であれば問題ありませんが、日本語圏で使われるファイルでは、なかなかそうもいきません。
検索結果の出力順が検索する度に異なるのも少し使いにくいと感じます。
その点、highwayはEUC-JPやShift_JISをサポートしており、検索結果の表示順の問題もありません。
highwayのメリット
agの問題点であげた点をhighwayはクリアしています。
また、速度もagよりも高速です。
ベンチマークについては以下の記事をご覧ください。
http://tkengo.github.io/blog/2015/10/19/release-highway/
highwayのインストール
For OS X
homebrewでインストールできます。
1 | $ brew tap tkengo/highway |
For Fedora Core
1 | $ sudo vi /etc/yum.repos.d/highway.repo |
使い方
1 | # カレントディレクトリをhogeをいう文字列で再帰的に検索 |
unite.vimと連携する
unite.vimのgrepにhighwayを使うようにします。
1 | " grep検索 |
おわりに
grepツールは完全にhighwayに乗り換えましたが、速度面、機能面に関しては問題ありません。
まだgrepで頑張っている人はもちろん,agをすでに使っている人であっても,highwayの利用を検討する価値は充分にあると思います。