AIVentureBeat1 day ago

Google's DiffusionGemma generates 256 tokens in parallel

6 min read

Google released DiffusionGemma, a text model that generates 256 tokens in parallel using diffusion instead of left-to-right token generation. The model can self-correct its output during generation. This approach keeps GPUs saturated during local inference, where standard models leave GPUs idle most of the time.

Level

Hype check

Tap to vote and see what everyone thinks.

#google #ai #diffusion

Google's DiffusionGemma generates 256 tokens in parallel

More to chew on!