Fixed-point Inversion for Text-to-image diffusion modelshttps://arxiv.org/abs/2312.12540요약: DDIM Inversion에서 각 스텝마다 인버전을 위해 linearity를 가정하고 뒤로 가는 노이즈를 forward noise로부터 근사를 하는데, 각 스텝마다 근사 에러가 누적되어 결과가 정확하지 않다. 이를 해결하기 위해 근사가 도입되기 전의 DDIM inversion 식을 implicit function 꼴로 만들고, implicit function을 풀 때 일반적으로 사용하는 수치해석기법인 fixed-point iteration을 통해 해를 구하면 훨씬 정확한 인버전이 가능하다! 이번엔 ChatGPT를 활용해 번역해 봤는데 결과가 ..
Analysis of Classifier-Free Guidance Weight Schedulershttps://arxiv.org/abs/2404.13040 Analysis of Classifier-Free Guidance Weight SchedulersClassifier-Free Guidance (CFG) enhances the quality and condition adherence of text-to-image diffusion models. It operates by combining the conditional and unconditional predictions using a fixed weight. However, recent works vary the weights throughout tha..