Computer Vision and Pattern Recognition

Authors and titles for recent submissions, skipping first 600

[ total of 778 entries: 1-50 | ... | 451-500 | 501-550 | 551-600 | 601-650 | 651-700 | 701-750 | 751-778 ]
[ showing 50 entries per page: fewer | more | all ]

Tue, 2 Dec 2025 (continued, showing 50 of 278 entries)

[601] arXiv:2512.01153 [pdf, ps, other]: Title: DPAC: Distribution-Preserving Adversarial Control for Diffusion Sampling

Authors: Han-Jin Lee, Han-Ju Lee, Jin-Seong Kim, Seok-Hwan Choi

Subjects: Computer Vision and Pattern Recognition (cs.CV); Artificial Intelligence (cs.AI); Machine Learning (cs.LG)
[602] arXiv:2512.01148 [pdf, ps, other]: Title: SocialFusion: Addressing Social Degradation in Pre-trained Vision-Language Models

Authors: Hamza Tahboub, Weiyan Shi, Gang Hua, Huaizu Jiang

Comments: 22 pages, 10 figures

Subjects: Computer Vision and Pattern Recognition (cs.CV); Artificial Intelligence (cs.AI)
[603] arXiv:2512.01145 [pdf, ps, other]: Title: Weakly Supervised Continuous Micro-Expression Intensity Estimation Using Temporal Deep Neural Network

Authors: Riyadh Mohammed Almushrafy (Majmaah University, Saudi Arabia)

Subjects: Computer Vision and Pattern Recognition (cs.CV)
[604] arXiv:2512.01128 [pdf, ps, other]: Title: OmniFD: A Unified Model for Versatile Face Forgery Detection

Authors: Haotian Liu, Haoyu Chen, Chenhui Pan, You Hu, Guoying Zhao, Xiaobai Li

Subjects: Computer Vision and Pattern Recognition (cs.CV)
[605] arXiv:2512.01116 [pdf, ps, other]: Title: Structural Prognostic Event Modeling for Multimodal Cancer Survival Analysis

Authors: Yilan Zhang, Li Nanbo, Changchun Yang, Jürgen Schmidhuber, Xin Gao

Comments: 37 pages, 14 Figures

Subjects: Computer Vision and Pattern Recognition (cs.CV)
[606] arXiv:2512.01103 [pdf, ps, other]: Title: Learning Eigenstructures of Unstructured Data Manifolds

Authors: Roy Velich, Arkadi Piven, David Bensaïd, Daniel Cremers, Thomas Dagès, Ron Kimmel

Subjects: Computer Vision and Pattern Recognition (cs.CV)
[607] arXiv:2512.01095 [pdf, ps, other]: Title: CycliST: A Video Language Model Benchmark for Reasoning on Cyclical State Transitions

Authors: Simon Kohaut, Daniel Ochs, Shun Zhang, Benedict Flade, Julian Eggert, Kristian Kersting, Devendra Singh Dhami

Subjects: Computer Vision and Pattern Recognition (cs.CV); Artificial Intelligence (cs.AI); Machine Learning (cs.LG)
[608] arXiv:2512.01094 [pdf, ps, other]: Title: Accelerating Inference of Masked Image Generators via Reinforcement Learning

Authors: Pranav Subbaraman, Shufan Li, Siyan Zhao, Aditya Grover

Comments: 15 pages, 9 figures

Subjects: Computer Vision and Pattern Recognition (cs.CV)
[609] arXiv:2512.01085 [pdf, ps, other]: Title: Generalized Medical Phrase Grounding

Authors: Wenjun Zhang, Shekhar S. Chandra, Aaron Nicolson

Subjects: Computer Vision and Pattern Recognition (cs.CV); Computation and Language (cs.CL)
[610] arXiv:2512.01059 [pdf, ps, other]: Title: Parameter Reduction Improves Vision Transformers: A Comparative Study of Sharing and Width Reduction

Authors: Anantha Padmanaban Krishna Kumar (Boston University)

Comments: 7 pages total (6 pages main text, 1 page references), 1 figures, 2 tables. Code available at this https URL

Subjects: Computer Vision and Pattern Recognition (cs.CV); Artificial Intelligence (cs.AI); Machine Learning (cs.LG)
[611] arXiv:2512.01048 [pdf, ps, other]: Title: TRoVe: Discovering Error-Inducing Static Feature Biases in Temporal Vision-Language Models

Authors: Maya Varma, Jean-Benoit Delbrouck, Sophie Ostmeier, Akshay Chaudhari, Curtis Langlotz

Comments: NeurIPS 2025

Subjects: Computer Vision and Pattern Recognition (cs.CV)
[612] arXiv:2512.01030 [pdf, ps, other]: Title: Lotus-2: Advancing Geometric Dense Prediction with Powerful Image Generative Model

Authors: Jing He, Haodong Li, Mingzhi Sheng, Ying-Cong Chen

Comments: Work done at the Hong Kong University of Science and Technology (Guangzhou). Project page: this https URL

Subjects: Computer Vision and Pattern Recognition (cs.CV)
[613] arXiv:2512.01008 [pdf, ps, other]: Title: LISA-3D: Lifting Language-Image Segmentation to 3D via Multi-View Consistency

Authors: Zhongbin Guo, Jiahe Liu, Wenyu Gao, Yushan Li, Chengzhi Li, Ping Jian

Subjects: Computer Vision and Pattern Recognition (cs.CV)
[614] arXiv:2512.00999 [pdf, ps, other]: Title: Provenance-Driven Reliable Semantic Medical Image Vector Reconstruction via Lightweight Blockchain-Verified Latent Fingerprints

Authors: Mohsin Rasheed, Abdullah Al-Mamun

Subjects: Computer Vision and Pattern Recognition (cs.CV); Artificial Intelligence (cs.AI)
[615] arXiv:2512.00995 [pdf, ps, other]: Title: S2AM3D: Scale-controllable Part Segmentation of 3D Point Cloud

Authors: Han Su, Tianyu Huang, Zichen Wan, Xiaohe Wu, Wangmeng Zuo

Subjects: Computer Vision and Pattern Recognition (cs.CV)
[616] arXiv:2512.00993 [pdf, ps, other]: Title: PhotoFramer: Multi-modal Image Composition Instruction

Authors: Zhiyuan You, Ke Wang, He Zhang, Xin Cai, Jinjin Gu, Tianfan Xue, Chao Dong, Zhoutong Zhang

Subjects: Computer Vision and Pattern Recognition (cs.CV)
[617] arXiv:2512.00975 [pdf, ps, other]: Title: MM-ACT: Learn from Multimodal Parallel Generation to Act

Authors: Haotian Liang, Xinyi Chen, Bin Wang, Mingkang Chen, Yitian Liu, Yuhao Zhang, Zanxin Chen, Tianshuo Yang, Yilun Chen, Jiangmiao Pang, Dong Liu, Xiaokang Yang, Yao Mu, Wenqi Shao, Ping Luo

Comments: 17 pages

Subjects: Computer Vision and Pattern Recognition (cs.CV); Machine Learning (cs.LG); Robotics (cs.RO)
[618] arXiv:2512.00960 [pdf, ps, other]: Title: Efficient and Scalable Monocular Human-Object Interaction Motion Reconstruction

Authors: Boran Wen, Ye Lu, Keyan Wan, Sirui Wang, Jiahong Zhou, Junxuan Liang, Xinpeng Liu, Bang Xiao, Dingbang Huang, Ruiyang Liu, Yong-Lu Li

Subjects: Computer Vision and Pattern Recognition (cs.CV)
[619] arXiv:2512.00953 [pdf, ps, other]: Title: Adaptive Evidential Learning for Temporal-Semantic Robustness in Moment Retrieval

Authors: Haojian Huang, Kaijing Ma, Jin Chen, Haodong Chen, Zhou Wu, Xianghao Zang, Han Fang, Chao Ban, Hao Sun, Mulin Chen, Zhongjiang He

Comments: Accepted by AAAI 2026, 10 pages, 9 figures, 5 tables

Subjects: Computer Vision and Pattern Recognition (cs.CV)
[620] arXiv:2512.00944 [pdf, ps, other]: Title: Binary-Gaussian: Compact and Progressive Representation for 3D Gaussian Segmentation

Authors: An Yang, Chenyu Liu, Jun Du, Jianqing Gao, Jia Pan, Jinshui Hu, Baocai Yin, Bing Yin, Cong Liu

Journal-ref: AAAI2026

Subjects: Computer Vision and Pattern Recognition (cs.CV)
[621] arXiv:2512.00936 [pdf, ps, other]: Title: SceneProp: Combining Neural Network and Markov Random Field for Scene-Graph Grounding

Authors: Keita Otani, Tatsuya Harada

Comments: Accepted to WACV 2026

Subjects: Computer Vision and Pattern Recognition (cs.CV)
[622] arXiv:2512.00927 [pdf, ps, other]: Title: LAHNet: Local Attentive Hashing Network for Point Cloud Registration

Authors: Wentao Qu, Xiaoshui Huang, Liang Xiao

Subjects: Computer Vision and Pattern Recognition (cs.CV)
[623] arXiv:2512.00912 [pdf, ps, other]: Title: ForamDeepSlice: A High-Accuracy Deep Learning Framework for Foraminifera Species Classification from 2D Micro-CT Slices

Authors: Abdelghafour Halimi, Ali Alibrahim, Didier Barradas-Bautista, Ronell Sicat, Abdulkader M. Afifi

Subjects: Computer Vision and Pattern Recognition (cs.CV); Artificial Intelligence (cs.AI); Machine Learning (cs.LG)
[624] arXiv:2512.00911 [pdf, ps, other]: Title: Dual-Projection Fusion for Accurate Upright Panorama Generation in Robotic Vision

Authors: Yuhao Shan, Qianyi Yuan, Jingguo Liu, Shigang Li, Jianfeng Li, Tong Chen

Subjects: Computer Vision and Pattern Recognition (cs.CV)
[625] arXiv:2512.00909 [pdf, ps, other]: Title: TalkingPose: Efficient Face and Gesture Animation with Feedback-guided Diffusion Model

Authors: Alireza Javanmardi, Pragati Jaiswal, Tewodros Amberbir Habtegebrial, Christen Millerdurai, Shaoxiang Wang, Alain Pagani, Didier Stricker

Comments: WACV 2026, Project page available at this https URL

Subjects: Computer Vision and Pattern Recognition (cs.CV)
[626] arXiv:2512.00904 [pdf, ps, other]: Title: Hierarchical Semantic Alignment for Image Clustering

Authors: Xingyu Zhu, Beier Zhu, Yunfan Li, Junfeng Fang, Shuo Wang, Kesen Zhao, Hanwang Zhang

Comments: AAAI 2026

Subjects: Computer Vision and Pattern Recognition (cs.CV); Machine Learning (cs.LG)
[627] arXiv:2512.00903 [pdf, ps, other]: Title: SwiftVLA: Unlocking Spatiotemporal Dynamics for Lightweight VLA Models at Minimal Overhead

Authors: Chaojun Ni, Cheng Chen, Xiaofeng Wang, Zheng Zhu, Wenzhao Zheng, Boyuan Wang, Tianrun Chen, Guosheng Zhao, Haoyun Li, Zhehao Dong, Qiang Zhang, Yun Ye, Yang Wang, Guan Huang, Wenjun Mei

Subjects: Computer Vision and Pattern Recognition (cs.CV); Robotics (cs.RO)
[628] arXiv:2512.00891 [pdf, ps, other]: Title: Accelerating Streaming Video Large Language Models via Hierarchical Token Compression

Authors: Yiyu Wang, Xuyang Liu, Xiyan Gui, Xinying Lin, Boxue Yang, Chenfei Liao, Tailai Chen, Linfeng Zhang

Comments: Code is avaliable at \url{this https URL}

Subjects: Computer Vision and Pattern Recognition (cs.CV)
[629] arXiv:2512.00887 [pdf, ps, other]: Title: Multilingual Training-Free Remote Sensing Image Captioning

Authors: Carlos Rebelo, Gil Rocha, João Daniel Silva, Bruno Martins

Subjects: Computer Vision and Pattern Recognition (cs.CV)
[630] arXiv:2512.00885 [pdf, ps, other]: Title: HanDyVQA: A Video QA Benchmark for Fine-Grained Hand-Object Interaction Dynamics

Authors: Masatoshi Tateno, Gido Kato, Hirokatsu Kataoka, Yoichi Sato, Takuma Yagi

Comments: Project page: this https URL

Subjects: Computer Vision and Pattern Recognition (cs.CV)
[631] arXiv:2512.00882 [pdf, ps, other]: Title: Look, Recite, Then Answer: Enhancing VLM Performance via Self-Generated Knowledge Hints

Authors: Xisheng Feng

Subjects: Computer Vision and Pattern Recognition (cs.CV); Artificial Intelligence (cs.AI)
[632] arXiv:2512.00880 [pdf, ps, other]: Title: Quantum-Inspired Spectral Geometry for Neural Operator Equivalence and Structured Pruning

Authors: Haijian Shao, Wei Liu, Xing Deng

Comments: 6 pages, 1 figure, preliminary version; concepts and simulation experiments only

Subjects: Computer Vision and Pattern Recognition (cs.CV)
[633] arXiv:2512.00877 [pdf, ps, other]: Title: Feed-Forward 3D Gaussian Splatting Compression with Long-Context Modeling

Authors: Zhening Liu, Rui Song, Yushi Huang, Yingdong Hu, Xinjie Zhang, Jiawei Shao, Zehong Lin, Jun Zhang

Subjects: Computer Vision and Pattern Recognition (cs.CV)
[634] arXiv:2512.00873 [pdf, ps, other]: Title: Neural Discrete Representation Learning for Sparse-View CBCT Reconstruction: From Algorithm Design to Prospective Multicenter Clinical Evaluation

Authors: Haoshen Wang, Lei Chen, Wei-Hua Zhang, Linxia Wu, Yong Luo, Zengmao Wang, Yuan Xiong, Chengcheng Zhu, Wenjuan Tang, Xueyi Zhang, Wei Zhou, Xuhua Duan, Lefei Zhang, Gao-Jun Teng, Bo Du, Huangxuan Zhao

Subjects: Computer Vision and Pattern Recognition (cs.CV)
[635] arXiv:2512.00872 [pdf, ps, other]: Title: TAP-CT: 3D Task-Agnostic Pretraining of Computed Tomography Foundation Models

Authors: Tim Veenboer, George Yiasemis, Eric Marcus, Vivien Van Veldhuizen, Cees G. M. Snoek, Jonas Teuwen, Kevin B. W. Groot Lipman

Comments: 22 pages, 4 figures, 8 tables

Subjects: Computer Vision and Pattern Recognition (cs.CV); Artificial Intelligence (cs.AI)
[636] arXiv:2512.00850 [pdf, ps, other]: Title: Smol-GS: Compact Representations for Abstract 3D Gaussian Splatting

Authors: Haishan Wang, Mohammad Hassan Vali, Arno Solin

Subjects: Computer Vision and Pattern Recognition (cs.CV)
[637] arXiv:2512.00846 [pdf, ps, other]: Title: AFRAgent : An Adaptive Feature Renormalization Based High Resolution Aware GUI agent

Authors: Neeraj Anand, Rishabh Jain, Sohan Patnaik, Balaji Krishnamurthy, Mausoom Sarkar

Comments: Accepted at WACV 2026 Conference

Subjects: Computer Vision and Pattern Recognition (cs.CV)
[638] arXiv:2512.00832 [pdf, ps, other]: Title: PanFlow: Decoupled Motion Control for Panoramic Video Generation

Authors: Cheng Zhang, Hanwen Liang, Donny Y. Chen, Qianyi Wu, Konstantinos N. Plataniotis, Camilo Cruz Gambardella, Jianfei Cai

Comments: Accepted by AAAI. Code: this https URL

Subjects: Computer Vision and Pattern Recognition (cs.CV)
[639] arXiv:2512.00814 [pdf, ps, other]: Title: IRPO: Boosting Image Restoration via Post-training GRPO

Authors: Haoxuan Xu. Yi Liu, Boyuan Jiang, Jinlong Peng, Donghao Luo, Xiaobin Hu, Shuicheng Yan, Haoang Li

Subjects: Computer Vision and Pattern Recognition (cs.CV)
[640] arXiv:2512.00805 [pdf, ps, other]: Title: Thinking with Drafts: Speculative Temporal Reasoning for Efficient Long Video Understanding

Authors: Pengfei Hu, Meng Cao, Yingyao Wang, Yi Wang, Jiahua Dong, Jun Song, Yu Cheng, Bo Zheng, Xiaodan Liang

Subjects: Computer Vision and Pattern Recognition (cs.CV)
[641] arXiv:2512.00796 [pdf, ps, other]: Title: CircleFlow: Flow-Guided Camera Blur Estimation using a Circle Grid Target

Authors: Jiajian He, Enjie Hu, Shiqi Chen, Tianchen Qiu, Huajun Feng, Zhihai Xu, Yueting Chen

Subjects: Computer Vision and Pattern Recognition (cs.CV)
[642] arXiv:2512.00794 [pdf, ps, other]: Title: PolarGS: Polarimetric Cues for Ambiguity-Free Gaussian Splatting with Accurate Geometry Recovery

Authors: Bo Guo, Sijia Wen, Yifan Zhao, Jia Li, Zhiming Zheng

Subjects: Computer Vision and Pattern Recognition (cs.CV)
[643] arXiv:2512.00773 [pdf, ps, other]: Title: DEJIMA: A Novel Large-scale Japanese Dataset for Image Captioning and Visual Question Answering

Authors: Toshiki Katsube, Taiga Fukuhara, Kenichiro Ando, Yusuke Mukuta, Kohei Uehara, Tatsuya Harada

Subjects: Computer Vision and Pattern Recognition (cs.CV)
[644] arXiv:2512.00771 [pdf, ps, other]: Title: EAG3R: Event-Augmented 3D Geometry Estimation for Dynamic and Extreme-Lighting Scenes

Authors: Xiaoshan Wu, Yifei Yu, Xiaoyang Lyu, Yihua Huang, Bo Wang, Baoheng Zhang, Zhongrui Wang, Xiaojuan Qi

Comments: Accepted at NeurIPS 2025 (spotlight)

Subjects: Computer Vision and Pattern Recognition (cs.CV); Artificial Intelligence (cs.AI)
[645] arXiv:2512.00765 [pdf, ps, other]: Title: The Outline of Deception: Physical Adversarial Attacks on Traffic Signs Using Edge Patches

Authors: Haojie Ji, Te Hu, Haowen Li, Long Jin, Chongshi Xin, Yuchi Yao, Jiarui Xiao

Subjects: Computer Vision and Pattern Recognition (cs.CV)
[646] arXiv:2512.00762 [pdf, ps, other]: Title: Seeing the Wind from a Falling Leaf

Authors: Zhiyuan Gao, Jiageng Mao, Hong-Xing Yu, Haozhe Lou, Emily Yue-Ting Jia, Jernej Barbic, Jiajun Wu, Yue Wang

Comments: Accepted at NeurIPS 2025

Subjects: Computer Vision and Pattern Recognition (cs.CV)
[647] arXiv:2512.00752 [pdf, ps, other]: Title: Charts Are Not Images: On the Challenges of Scientific Chart Editing

Authors: Shawn Li, Ryan Rossi, Sungchul Kim, Sunav Choudhary, Franck Dernoncourt, Puneet Mathur, Zhengzhong Tu, Yue Zhao

Subjects: Computer Vision and Pattern Recognition (cs.CV)
[648] arXiv:2512.00748 [pdf, ps, other]: Title: Probabilistic Modeling of Multi-rater Medical Image Segmentation for Diversity and Personalization

Authors: Ke Liu, Shangde Gao, Yichao Fu, Shangqi Gao, Chunhua Shen

Subjects: Computer Vision and Pattern Recognition (cs.CV); Artificial Intelligence (cs.AI)
[649] arXiv:2512.00744 [pdf, ps, other]: Title: Joint Multi-scale Gated Transformer and Prior-guided Convolutional Network for Learned Image Compression

Authors: Zhengxin Chen, Xiaohai He, Tingrong Zhang, Shuhua Xiong, Chao Ren

Subjects: Computer Vision and Pattern Recognition (cs.CV)
[650] arXiv:2512.00743 [pdf, ps, other]: Title: Multi-GRPO: Multi-Group Advantage Estimation for Text-to-Image Generation with Tree-Based Trajectories and Multiple Rewards

Authors: Qiang Lyu, Zicong Chen, Chongxiao Wang, Haolin Shi, Shibo Gao, Ran Piao, Youwei Zeng, Jianlou Si, Fei Ding, Jing Li, Chun Pong Lau, Weiqiang Wang

Comments: 20 pages, 15 figures

Subjects: Computer Vision and Pattern Recognition (cs.CV)

[ total of 778 entries: 1-50 | ... | 451-500 | 501-550 | 551-600 | 601-650 | 651-700 | 701-750 | 751-778 ]
[ showing 50 entries per page: fewer | more | all ]

Disable MathJax (What is MathJax?)

Links to: arXiv, form interface, find, cs, new, 2512, contact, help (Access key information)

> cs > cs.CV

Computer Vision and Pattern Recognition

Authors and titles for recent submissions, skipping first 600

Tue, 2 Dec 2025 (continued, showing 50 of 278 entries)