-
Notifications
You must be signed in to change notification settings - Fork 7
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
JavaScript版追加 #5
Comments
多分 |
ありがとうございます! /~https://github.com/foliojs/grapheme-breaker を使ってみたのですが、下記、結合絵文字に非対応だったので、こちら発見しベースにさせてもらった感じです const t = s => console.log(s, s.length) /~https://github.com/yumetodo/grapheme-breaker-u10-0 |
Sharp とか DotNet とかの接頭辞・接尾辞を付けずにリポジトリを作ったこちらも悪いんですが、このリポジトリは C# 向けの実装を置くために作ったものです。 ここに置いたコードは MIT ライセンスですし、使っていただいたり参考にして他言語向け実装を作っていただくこと自体は全く問題ありません。 作ったはいいものの置き場に困っているということならこのリポジトリに merge すること自体は構わないんですが、継続保守や、npm などへのリリース作業はこちらではできません。 という前提で、 #6 はどうしましょうか? |
そもそもwasmがある今、必要なのはどちらかというと他の言語のライブラリをwasmとしてコンパイルしてJavaScriptから使える薄いラッパーじゃなかろうかみたいな思いもあり(ちなみに私はicuをビルドしようとして挫折してます)。 |
少々オフトピックですが… ICU はフルに参照してしまうとメガ単位(16MBとかでしたっけ)になるのがちょっと大変そうですね。 |
なるほど・・・ |
退役方向とのこと了解です。PRはcloseしておきました。お手数おかけしました。 icu、見てみましたが、広範囲に渡りサイズも大きくwasm化するにもちょっとヘビーですね。 Unicode、おもしろいですね! |
ちなみに、Chromium も WebKit も ICU を参照してるっぽいので、普通に wasm から参照させてくれ… とか思ったりしなくも。 とりあえず issue は close いたします。 |
書記素分解のみなら数KBでできるんですね |
ExtPict、たぶん、Extended_Pictographicですかね。 Unicode 10 と 11 の間で方式がだいぶ変わってるんですよね。 |
( @taisukef 他に書くべき適当な場所を見つけられなかったのでここに書きますが、/~https://github.com/taisukef/grapheme-breaker-mjs にIssue立てられるようにしてください・・・あと |
なるほど、そちらも見る必要があるのですね! |
便利なコード提供、ありがとうございます!
forkし、JavaScript版を追加しました(生成部分はノータッチです)
/~https://github.com/taisukef/GraphemeSplitter
The text was updated successfully, but these errors were encountered: