Research
Creative Research
研究テーマ
広告クリエイティブの制作支援と自動生成
チームミッション
Creative Researchチームではクリエイティブワークフローの革新を目指して研究開発に取り組んでいます。バナー広告や動画広告などの広告表現の制作において、どういった視聴者層にどういった表現を届けるのかを適切に考慮することが、最終的な広告効果を左右します。しかし様々な要因が複雑に絡み合うデジタル広告の配信の中で、最終的な広告効果を織り込んで制作するのはクリエイターにとっては大きな挑戦となります。Creative Researchチームでは機械学習を用いて事前に広告効果に関連する要素をクリエイターに提示してワークフローを支援するような技術や、高品質なグラフィックデザインを自動生成するような技術開発に取り組んでいます。深層学習、画像認識、コンピュータグラフィックス、自然言語処理など複数の領域にまたがる研究に取り組み、クリエイティブ制作に変革をもたらすことを目指しています。
プロジェクト
① グラフィックデザインの自動生成
グラフィックデザインの完成品は一枚の画像として表示されます。しかし、その制作過程では編集の容易性や柔軟性のため、画像やテキストなど複数のレイヤー群を持つベクタ形式のデータとして扱います (例: SVG, PDF, PPTX, PSD)。ベクタ形式でのデザインの生成は、画像や文章の生成と比べても技術的に興味深い独自の課題が存在します。この研究では、入力プロンプトからベクタ形式のデザインを自動生成しました。LLMやtext-to-image といった基盤モデルを工夫して組み込むことで、まずまずの質の生成に成功しました。
② グラフィックデザインの分解・構造化
動画バナー広告などのアニメーション付きグラフィックデザインの完成品を編集可能な要素に分解する研究に取り組みました。我々はこのような動画を静止画テクスチャとそのアニメーションで表現される要素群として表現できると定式化し、大規模事前学習モデルとサンプル単位の最適化を組み合わせることで高速かつ高品質な要素分解を実現しています。分解された要素に変更を加えることで物体の差し替えや動きの変更などの動画編集が容易となります。このようなグラフィックデザインの完成品を構造化する研究は、デザイン編集支援をはじめとした幅広い応用先と独自の技術的挑戦があり、注目している研究分野の一つです。
③ デザイン制作支援ツールの開発
バナー画像制作では効果の高いデザイン作りが鍵となります。これまで広告制作支援のために広告効果を予測する取り組みは多数行われてきましたが、本研究ではこれに加えて「なぜバナーの効果が高い/低いのか」「効果を上げるためにどこを編集すべきか」をデザイナーに視覚的にフィードバックするツールを提案しています。既存の予測根拠説明手法をグラフィックデザインの基本編集単位であるレイヤー単位に適応させることで具体的な編集アクションにつながるフィードバックを実現しています。実際にツールを開発しデザイナーに使用してもらうことで、提案ツールによる制作効率や体験をの向上を確認しています。
④ グラフィックデザインの審美性の自動評価
基盤モデルの進歩は、グラフィックデザイン生成においても有望な能力を示しています。しかし、依然としてグラフィックデザインの良し悪しの評価に関しては十分な検討がなされていませんでした。良いグラフィックデザインの基準の1つとして、グラフィックデザインの基本原則に従っていることが挙げられます。この研究ではGPTを用いて、そのような原則に従ったグラフィックデザインの評価を行いました。この結果、GPTによる評価は人間による評価と相関があることがわかりました。
研究領域
機械学習 / コンピュータビジョン / 画像処理 / マルチメディア
所属メンバー
論文一覧
-
LayoutFlow: Flow Matching for Layout Generation
コンピュータビジョン
ECCV2024
-
Exploring the Capability of Mamba in Speech Applications
音声認識
INTERSPEECH 2024
-
An Attribute Interpolation Method in Speech Synthesis by Model Merging
音声合成
INTERSPEECH 2024
-
Retrieval-Augmented Layout Transformer for Content-Aware Layout Generation
コンピュータビジョン
CVPR 2024
-
グラフィックデザインの教師ありレイヤー分解
コンピュータビジョン
MIRU2023
-
Text-to-Image手法を使用した広告画像生成と構図提案
コンピュータビジョン
MIRU2023
-
LayoutDM: Discrete Diffusion Model for Controllable Layout Generation
コンピュータビジョン
CVPR 2023
-
Towards Flexible Multi-modal Document Models
コンピュータビジョン
CVPR 2023
-
Structured State Space Decoder for Speech Recognition and Synthesis
音声認識
ICASSP 2023
-
Generative Colorization of Structured Mobile Web Pages
マルチメディア
WACV 2023
-
Aggregate Learning for Mixed-Frequency Data
経済学
2022 IEEE International Conference on Big Data Workshop The Fifth Workshop on Big Data for Economic and Business Forecasting
-
Towards Universal Multi-Modal Layout Models
コンピュータビジョン
MIRU2022
-
モバイルWebページの構造的な色付け
マルチメディア
MIRU 2022
-
Constrained Graphic Layout Generation via Latent Optimization
コンピュータビジョン
ACM Multimedia 2021
-
CanvasVAE: Learning to Generate Vector Graphic Documents
コンピュータビジョン
ICCV 2021
-
Modeling Visual Containment for Web Page Layout Optimization
レイアウト
Computer Graphics Forum (Pacific Graphics 2021)
-
ランク学習を用いた広告クリエイティブの配信優先度の推定
コンピュータビジョン
JSAI2020
-
Simple and Scalable Parallelized Bayesian Optimization
機械学習
NewInML forum (co-located with NeurIPS)
-
広告バナー画像への自動テキスト配置
コンピュータビジョン
MIRU 2019
-
画像の圧縮トレードオフ推定
コンピュータビジョン
MIRU 2019
-
Serif or Sans: Visual Font Analytics on Book Covers and Online Advertisements
コンピュータビジョン
ICDAR2019
-
Regularizing Adversarial Training for Single-shot Object Placement
コンピュータビジョン
MIRU2019
-
CycleGAN を用いた感情スタイル転送
コンピュータビジョン
JSAI 2018
-
深層学習によるFacebook広告のCTR予測
コンピュータビジョン
JSAI 2018
-
Emotional Style Transfer for Stock Assets
コンピュータビジョン
CVPR 2018 Workshops
-
Feedback-prop: Convolutional Neural Network Inference under Partial Evidence
コンピュータビジョン
CVPR 2018
-
Computer Vision meets Fashion
コンピュータビジョン
『映像情報メディア学会誌』2017年11月号「衣・食・住に入り込む先端メディア技術」(第2章)
-
End-to-end learning potentials for structured attribute prediction
コンピュータビジョン
MIRU2017 優秀賞発表文献, arXiv
-
人工知能による新しい広告クリエイティブ
その他
人工知能学会誌 Vol. 32 No. 4 (2017/07)
-
Recommending Outfits From Personal Closet
コンピュータビジョン
Computer Vision for Fashion Workshop (ICCVW), 2017
-
検索連動型広告におけるテキスト自動生成とその評価指標の検討
自然言語処理
JSAI2015