DocMath-Eval: Evaluating Numerical Reasoning Capabilities of LLMs in Understanding Long Documents with Tabular Data.

Published in Arxiv, 2023

Zhao, Yilun\*, Yitao Long\*, **Hongjun Liu**, Linyong Nan, Lyuhao Chen, Ryo Kamoi, Yixin Liu, Xiangru Tang, Rui Zhang, and Arman Cohan. "DocMath-Eval: Evaluating Numerical Reasoning Capabilities of LLMs in Understanding Long Documents with Tabular Data." (*Equal Contribution) [Download paper here](https://arxiv.org/pdf/2311.09805.pdf)