[1]

“A Robust Two-Stage Retrieval-Augmented Vision-Language Framework for Knowledge-Intensive Multimodal Reasoning and Alignment”, CDIS- International Journal, vol. 2, no. 2, pp. 42–52, Feb. 2026, doi: 10.66279/2da0zk02.