Publications

PromptSuite: A Task-Agnostic Framework for Multi-Prompt Generation
Eliya Habba*, Noam Dahan*, Gili Lior, Gabriel Stanovsky
EMNLP 2025 System Demonstrations
PDF DATA CODE WEBSITE
ReliableEval: A Recipe for Stochastic LLM Evaluation via Method of Moments
Gili Lior, Eliya Habba, Shahar Levy, Avi Caciularu, Gabriel Stanovsky
Findings of EMNLP 2025
PDF CODE
WildIFEval: Instruction Following in the Wild
Gili Lior, Asaf Yehudai, Ariel Gera, Liat Ein-Dor
PDF DATA CODE
Comparing the Framing Effect in Humans and LLMs on Naturally Occurring Texts
Gili Lior, Liron Naccache, Gabriel Stanovsky
PDF DATA CODE