「canny」機能をわかりやすく解説ー写真からイラストを作成【ControlNet講座#11】｜Stable diffusion

Stable diffusionの「ControlNET&拡張機能講座」第11回目。画像から輪郭を抽出し、それを元に着色・画像をつくりだす「canny」機能についてです。

「lineart」と「scribble」の違いは前回でわかったけど、「canny」はどう違うのニャ？

けっきょくやることは「画像を白黒線画に変換」→「白黒線画から画像に変換」なので、その変換や出力に違いがあるだけといったところですね。なにを使うかはそのとき次第ですし、最終的にはとりあえずぜんぶ使って一番いい結果の画像をつかうという感じになるとは思います。経験則と目視確認の世界ですね。

それで「canny」ですが、「lineart」「scribble」に比べると基本的な抽出になります。

ポーズを指定する「openpose」がなかった時代には、写真の輪郭を抽出することによってポーズ指定するためにも使われていました。現在ではその役割をほぼ終えていますね。「openpose」については以下の記事を参照してください。

「OpenPose」「OpenPose Editor」機能をわかりやすく解説ー自由にポーズ変更【ControlNET講座#6】｜Stable Diffusion

「Stable Diffusion」のControlNET講座第6回。「OpenPose」「OpenPose Editor」機能を使って、自由にポーズを変更する方法です。これ第1回目にやるやつじゃないのかニャ？ポーズを変えると人物も変わ...

現在の「canny」の使用法としては、

・そこそこよく描けてる線画の着色
・すでにできたイラストの色変更。
・写真をイラスト化

になるとは思います。今回はこれらを説明していきます。

「lineart」とあまり変わらないのニャ。

「lineart」は線を抽出する、「canny」は輪郭を抽出するという違いはありますが、似たようなものですね。

ただこの点に関しても「lineart」にお株を奪われてしまっている感があります。

筆者的には「lineart」のほうが優秀とは思いますが、どっちも使ってみて、よい方を採用すればいいでしょう。最終的にはやはり目視確認です。人間の力は偉大です。

そんなわけで「canny」の導入・使い方をさくっと学んでいきましょう。前回の「「scribble」機能をわかりやすく解説ー落書きから画像を作成」は以下のリンクから。

「scribble」機能をわかりやすく解説ー落書きから画像を作成【ControlNet講座#10】｜Stable diffusion

Stable diffusionの「ControlNET&拡張機能講座」第10回目。ラフ画（落書き）から画像をつくりだす「scribble」機能についてです。前回の「Lineart」は線画から画像を作り出したのニャ。「Lineart」は...

「canny」のインストール
1. 「canny」用モデルのインストール
「canny」の使い方
1. イラストの色変更
2. 写真をイラストに変換
まとめ

「canny」のインストール

「ControlNetv1.1」以上をインストールした状態であることを前提に話を進めます。まだの方や、インストールしたけどバージョンがわからんという方は以下のリンクを参照。

「ControlNet」のインストール/アップデート方法をわかりやすく解説ーマルチにする方法も【Stable diffusion】

AIお絵描き「Stable diffusion」の「ControlNet」をインストール、もしくはアップデートする方法をさくっと手短に解説します。「ControlNet」は「Stable diffusion」に様々な追加機能をあたえるので、...

「canny」用モデルのインストール

まだモデルをダウンロードしていない方は、

lllyasviel/ControlNet-v1-1 at main

We???re on a journey to advance and democratize artificial intelligence through open source and open science.

から、1.45Gある「control_v11p_sd15_canny.pth」をダウンロードします（赤い箱マークに「LFS」と書いているボタンをクリックするとダウンロード）。

ダウンロードしたものは、「Stable Diffusion」をインストールしたフォルダ内の「stable-diffusion-webui」＞「models」＞「ControlNet」のフォルダに入れればOKです。

「canny」の使い方

「txt2img」でおこないます。基本的には「lineart」や「scribble」と手順はおなじですね。

これまでは子供の絵とか落書きとかを使っていましたが、今回は絵の上手い人のラフ画を使います。前回同様、下の方にある「ControlNet」を開き、元絵を「Single Image」に放り込みます。それから「ControlNet」を使用するため、「Enable」と「Pixel Perfect」にチェックを入れてください。

「Preprocessor」は「canny」に、「Model」は「control_v11p_sd15_canny」を設定。

「lineart」や「scribble」と違って、「Preprocessor」は「canny」1択しかないのニャ。

旧世代感はありますが、わかりやすいといえばわかりやすいですね。

それと画像のWidth（横幅）を720と、前回同様元画像に合わせてちょっと横長にしておきます。

プロンプトですが「super fine illustration,hammerhead shark,crouching,grabbing」など絵を認識しやすいような単語を適当に入れておきます。

それ以外はとくに設定はせず、あとはいつものごとく「Generate」ボタンを押すだけです。

結果がこちら。

うーん…、なんか思ったのと違うのニャ。

もう少しプロンプトを書いたほうがよさそうですね。

ちなみにおなじ元絵とプロンプトで「lineart」（「Preprocessor」は「lineart_realistic」）を使った場合はこうなります。いっさい設定に手を加えていません。

あきらかに「lineart」のほうが優秀ニャ！　「canny」はもはや過去の遺物ニャ！

正直、線画からイラストにするのは「lineart」のほうが優秀とは思います。

次はイラストの色を変更してみます。

イラストの色変更

「reference_only」の回で使った画像に再登場してもらいます。先ほどとおなじように設定し、画像は縦長なので「Height」を720にしておきます。プロンプトは画像を生成したときのものそのままを利用し、「red hair」と書いて髪を赤くしてみます。シードは固定。