Huanyu_Zhang's picture

Huanyu_Zhang

huanyu112

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 15 days ago

GENIUS: Generative Fluid Intelligence Evaluation Suite

upvoted a paper 17 days ago

GEBench: Benchmarking Image Generation Models as GUI Environments

upvoted a paper 21 days ago

Thinking in Frames: How Visual Context and Test-Time Scaling Empower Video Reasoning

View all activity

Organizations

upvoted a paper 15 days ago

GENIUS: Generative Fluid Intelligence Evaluation Suite

Paper • 2602.11144 • Published 15 days ago • 53

upvoted a paper 17 days ago

GEBench: Benchmarking Image Generation Models as GUI Environments

Paper • 2602.09007 • Published 17 days ago • 39

upvoted a paper 21 days ago

Thinking in Frames: How Visual Context and Test-Time Scaling Empower Video Reasoning

Paper • 2601.21037 • Published 29 days ago • 15

upvoted a paper 24 days ago

How Well Do Models Follow Visual Instructions? VIBE: A Systematic Benchmark for Visual Instruction-Driven Image Editing

Paper • 2602.01851 • Published 25 days ago • 16

submitted a paper to Daily Papers 24 days ago

How Well Do Models Follow Visual Instructions? VIBE: A Systematic Benchmark for Visual Instruction-Driven Image Editing

Paper • 2602.01851 • Published 25 days ago • 16

liked a dataset 24 days ago

VIBE-Benchmark/VIBE-Benchmark

Viewer • Updated 25 days ago • 2.65k • 408 • 2

updated a dataset 25 days ago

VIBE-Benchmark/VIBE-Benchmark

Viewer • Updated 25 days ago • 2.65k • 408 • 2

updated 13 datasets 26 days ago

VIBE-Benchmark/VIBE-Seedream4.0

Viewer • Updated 26 days ago • 1.03k • 31

VIBE-Benchmark/VIBE-Seedream4.5

Viewer • Updated 26 days ago • 1.03k • 46

VIBE-Benchmark/OmniGen

Viewer • Updated 26 days ago • 1.03k • 52

VIBE-Benchmark/VIBE-Banana-Flash

Viewer • Updated 26 days ago • 1.01k • 76

VIBE-Benchmark/VIBE-GPT-Image

Viewer • Updated 26 days ago • 1.01k • 139

VIBE-Benchmark/Edit-R1-Qwen-Image-Edit-2509

Viewer • Updated 26 days ago • 1.03k • 55

VIBE-Benchmark/Qwen-Image-Edit-2509

Viewer • Updated 26 days ago • 1.03k • 79

VIBE-Benchmark/VIBE-Qwen-Image-Edit

Viewer • Updated 26 days ago • 934 • 50

VIBE-Benchmark/FLUX2-dev

Viewer • Updated 26 days ago • 1.03k • 2.4k

VIBE-Benchmark/OmniGen2

Viewer • Updated 26 days ago • 1.03k • 29 • 1

VIBE-Benchmark/UniWorld-V1

Viewer • Updated 26 days ago • 1.03k • 27

VIBE-Benchmark/BAGEL

Viewer • Updated 26 days ago • 1.03k • 2.29k

VIBE-Benchmark/Step1X-Edit-v1p2

Viewer • Updated 26 days ago • 934 • 1.2k • 1