問題はDALL-Eの画像生成能力にあるといえよう。なお紙幅の都合上省略するが、上記と同様に、他の加工文においても、「私が入力したテクストの、どこをどう捉えて、このプロンプトを生成しましたか。」という質問に対し、文体・位相的な特徴を捉えていると判断できる応答が得られた。つぎに、原文画像と最も大きな相違が見られた「加工文7」の画像は図3のとおりである。「読み手」と「話題の人物」の両方に、軽卑表現がされているものであり、原文との待遇表現の差が著しい場合は、その特徴は画像にも明確に反映されるといえる。生成プロンプト(1回目)の日本語訳は、以下のとおりである。「この荒々しさを感じさせる写真には、険しい表情をした高齢の仏教僧が、擦り切れたサフラン色の僧衣をまとって、暗くなり始めた空の下、蓮池のほとりを独りで歩いている様子が描かれています。場面全体には緊張と重苦しさが漂い、強い影と厚い雲が空を覆っています。僧侶の姿勢はわずかに前かがみで、顔には疲労と年齢が刻まれています。」最後に、読み手と話題の人物への待遇表現の程度のズレについては、「加工文8」と「加工文10」に注目する。双方、表1中の「全体の雰囲気」には「わずかな緊張感や皮肉」「矛盾した丁寧さ」とあり、文体の「ねじれ」や待遇表現の不統一感を読み取っていることが伺われるが、画像化される際には、「話題の人物」への待遇表現が優先されると考えられ、「加工文8」では「原文画像」との大きな相違は見られなかった。「加工文10」(1回目)では、図4のような画像が生成された。生成プロンプトの日本語訳は、以下のとおりである。「東南アジア系の仏教僧が、曇り空の下、蓮池のそばをゆっくりと歩いている姿を全身で捉えた写真。彼は、色褪せて粗く見えるサフラン色の図3図4(47)文學藝術 第47号(2025)
元のページ ../index.html#110