Media Fundamentals - CyberAgent AI Lab

2025.11.17

Difficulty Controlled Diffusion Model for Synthesizing Effective Training Data

2024.9.27

The Lottery Ticket Hypothesis in Denoising: Towards Semantic-Driven Initialization

2024.9.26

Robust Nearest Neighbors for Source-Free Domain Adaptation under Class Distribution Shift

2024.9.26

How to Defend Image-Text Matching against Adversarial Attacks

2024.9.26

Source-Free Domain Adaptation with Class Distribution Shift via Generic Features

2024.1.16

Complementary-Contradictory Feature Regularization against Multimodal Overfitting

2023.9.27

Multimodal color recommendation in vector graphic documents

2023.7.31

Dissecting multimodal learning via regularized masking of multimodal features

2023.7.24

Toward Verifiable and Reproducible Human Evaluation for Text-to-Image Generation

2023.2.1

Color Recommendation for Vector Graphic Documents based on Multi-Palette Representation

2023.2.1

Contrastive Losses Are Natural Criteria for Unsupervised Video Summarization

2022.2.2

An Intelligent Color Recommendation Tool for Landing Page Design

2022.2.1

Optimal Correction Cost for Object Detection Evaluation

2022.2.1

Does robustness on ImageNet transfer to downstream tasks?

2022.2.1

Video Summarization Overview

2020.9.15

Uncovering Hidden Challenges in Query-Based Video Moment Retrieval

2020.5.12

BERT representations for Video Question Answering

2020.4.12

Knowledge-Based Visual Question Answering in Videos

2020.1.12

KnowIt VQA: Answering Knowledge-Based Questions about Videos

2019.12.12

Visually Grounded Paraphrase Identification via Gating and Phrase Localization

2019.11.25

コメディドラマにおける字幕と表情を用いた笑い予測