Apple Machine Learning APIs
home
動画
カテゴリは4つ
- Vision
- OCR系
- Text Detection
- https://developer.apple.com/documentation/vision/vndetecttextrectanglesrequest
- ざっくり仕様
- テキストの文字列を四角いbboxで返す
- 単語単位で配列で値が得られる
- 使用例
- Text Recognition
- https://developer.apple.com/documentation/vision/vnrecognizetextrequest
- ざっくり仕様
- まず画像内のすべての文字を検出してからanalyze処理をする
- 言語の指定や制約もプロパティに配列で好きな言語を渡すことで調整可能
- 文字のlocationとcontentを返り値とする
- 2022から日本語対応したとか
- 使用例
- Document Detection 🆕
- https://developer.apple.com/documentation/vision/vndetectdocumentsegmentationrequest
- #WWDC21で発表自体はされているので何がnewなのかはよく分からん
- ざっくり仕様
- 画像内の書類を認識する
- 文書の四隅の座標を返す
- 使用例
- いい感じの使用例が見当たらなかった
- ブログチャンス!


