Rubyメモ

2バイト文字が混じったテキストを読もうとしたときに以下のエラー

in `scan': invalid byte sequence in UTF-8 (ArgumentError)

UNICODE形式のテキスト

エンコードを指定したい

Ruby1.9ではKCODEが使えなくなった
どうすればいいかは以下
http://d.hatena.ne.jp/maluboh/20080222/p1

1.9での文字エンコーディング関連は以下
http://d.hatena.ne.jp/rubyco/20060318/charcount


文字列のマッチングを行うときに、面倒くさいのでupcaseかdowncaseで揃える。

s = "I love Ruby"

s1 = s.upcase #=> "I LOVE RUBY"
s2 = s.downcase #=> "i love ruby"

Arrayから重複要素を取り除く
array.uniq