Prof. Zhaoxiang Zhang

National Laboratory of Pattern Recognition,

Institute of Automation, Chinese Academy of Sciences

University of Chinese Academy of Sciences

Email: zhaoxiang[dot]zhang[at]ia[dot]ac[dot]cn

zhaoxiang[dot]zhang[at]ieee[dot]org

Opening Positions: Student, Intern, PostDoc and Faculty

Selected Publications

2025:

Q Wang, Y Chen, Z Zhang*. Uncertain Object Representation for Image-Based 3D Object Perception(IEEE TPAMI) [PDF]
Xiao Chen, Changyi Ma, Wenqi Fan, Li Qing, Z Zhang*. C2KD: Cross-layer and Cross-head Knowledge Distillation for Small Language Model-based Recommendation (ACL) [PDF]
X Chen, X Jiang, Y Tao, Z Lei, Q Li, C Lei, Z Zhang*. FIRM: Flexible Interactive Reflection ReMoval (AAAI) [PDF]
Haochen Wang, Junsong Fan, Yuxi Wang, Kaiyou Song, Tiancai Wang, Xiangyu Zhang, Zhaoxiang Zhang*. Bootstrap Masked Visual Modeling Via Hard Patch Mining (IEEE TPAMI) [PDF]
H Wang, Y Zhao, T Wang, H Fan, X Zhang, Z Zhang*. ROSS3D: Reconstructive Visual Instruction Tuning with 3D-Awareness (ICLR) [PDF]
Y Li, Y Wang, Y Liu, J He, L Fan, Z Zhang*. End-to-End Driving with Online Trajectory Evaluation via BEV World Model (ICLR) [PDF]
Haochen Wang, Yuchao Wang, Yujun Shen, Junsong Fan, Yuxi Wang, Zhaoxiang Zhang*. Using unreliable pseudo-labels for label-efficient semantic segmentation (IJCV) [PDF]
He Guan, Chunfeng Song, Zhaoxiang Zhang*. Lidar-camera Cooperative Semantic Segmentation (MIR) [PDF]
J Zhou, L Fan, L Huang, X Shi, S Liu, Z Zhang, H Li. FlexDrive: Toward Trajectory Flexibility in Driving Scene Gaussian Splatting Reconstruction and Rendering (CVPR) [PDF]
MAP Team, X Du, Y Yao, K Ma, B Wang, T Zheng, K Zhu, M Liu, Zhaoxiang Zhang, et al. SuperGPQA: Scaling LLM Evaluation across 285 Graduate Disciplines (CoRR) [PDF]
L Fan, H Zhang, Q Wang, H Li, Z Zhang*. Freesim: Toward free-viewpoint camera simulation in driving scenes (CVPR) [PDF]
Z Lin, W Chen, X Jin, Y Yang, L Fan, Y Zhang, Z Zhang*, MCOP: Multi-UAV Collaborative Occupancy Prediction (ICCV) [PDF]

2024:

Jiaheng Liu, Zehao Ni, Haoran Que, Sun Sun, Noah Wang, Jian Yang, Hongcheng Guo, Zhongyuan Peng, Ge Zhang, Jiayi Tian, Xingyuan Bu, Ke Xu, Wenge Rong, Junran Peng, ZHAO-XIANG ZHANG*. RoleAgent: Building, Interacting, and Benchmarking High-quality Role-Playing Agents from Scripts (NeurIPS) [PDF]
Y Zhang, J Gao, F Ge, G Luo, B Li, ZX ZHANG, H Ling, W Hu. VQ-Map: Bird’s-Eye-View Map Layout Estimation in Tokenized Discrete Space via Vector Quantization (NeurIPS) [PDF]
H Zhao, L Fan, Y Chen, H Wang, X Jin, Y Zhang, G Meng, ZX ZHANG*. OpenSatMap: A Fine-grained High-resolution Satellite Dataset for Large-scale Map Construction (NeurIPS) [PDF]
Yuqi Wang, Ke Cheng, Jiawei He, Qitai Wang, Hengchen Dai, Yuntao Chen, Fei Xia, ZHAO-XIANG ZHANG*. Drivingdojo dataset: Advancing interactive and knowledge-enriched driving world model (NeurIPS) [PDF]
G Zhang, L Fan, C He, Z Lei, ZHAO-XIANG ZHANG, L Zhang. Voxel mamba: Group-free state space models for point cloud based 3d object detection (NeurIPS) [PDF]
Haoyuan Zhang, Xiangyu Zhu, Qu Tang, Zhaoxiang Zhang, Zhen Lei. STODINE: Decompose video to Object-centric Spatial-Temporal Slots for physical reasoning (ACM MM) [PDF]
L Fan, F Wang, N Wang, Z Zhang*. Fsd v2: Improving fully sparse 3d object detection with virtual voxels (IEEE TPAMI) [PDF]
H Wang, Y Shen, J Fei, W Li, L Wu, Y Wang, Z Zhang*. Pulling target to source: A new perspective on domain adaptive semantic segmentation (NeurIPS) [PDF]
Y Liu, C Luo, Z Mao, J Peng, Z Zhang*. CityGaussianV2: Efficient and Geometrically Accurate Reconstruction for Large-Scale Scenes (ICLR) [PDF]
Y Fang, C Chen, W Zhang, J Wu, Z Zhang, S Xie. Prototype learning for adversarial domain adaptation (Pattern Recognition) [PDF]
Zeyu Li, Ruitong Gan, Chuanchen Luo, Yuxi Wang, Jiaheng Liu, Ziwei Zhu, Qing Li, Xucheng Yin, Man Zhang, Zhaoxiang Zhang*, Junran Peng. Materialseg3d: Segmenting dense materials from 2d priors for 3d assets (ACM MM) [PDF]
Yiheng Huang, Hui Yang, Chuanchen Luo, Yuxi Wang, Shibiao Xu, Zhaoxiang Zhang, Man Zhang, Junran Peng. Stablemofusion: Towards robust and efficient diffusion-based motion generation framework (ACM MM) [PDF][GitHub]
Xulu Zhang, Wengyu Zhang, Xiaoyong Wei, Jinlin Wu, Zhaoxiang Zhang, Zhen Lei, Qing Li. Generative active learning for image synthesis personalization (ACM MM) [PDF]
Chi Zhang, Wenbo Chen, Wei Wang, Zhaoxiang Zhang*. MA-ST3D: Motion Associated Self-Training for Unsupervised Domain Adaptation on 3D Object Detection (IEEE TIP) [PDF]
Q Wang, L Fan, Y Wang, Y Chen, Z Zhang*, FreeVS: Generative View Synthesis on Free Driving Trajectory (ICLR) [PDF]
J Li, J Fan, Z Zhang*. Point-Supervised Panoptic Segmentation via Estimating Pseudo Labels from Learnable Distance (ECCV) [PDF]
J Zhan, T Liu, R Li, Z Zhang, Y Chen. CSOT: Cross-scan Object Transfer for Semi-Supervised LiDAR Object Detection (ECCV) [PDF]
Q Wang, J He, Y Chen, Z Zhang*. OneTrack: Demystifying the Conflict Between Detection and Tracking in End-to-End 3D Trackers (ECCV) [PDF]
H Yu, Y Wang, Y Chen, Z Zhang*. Monocular Occupancy Prediction for Scalable Indoor Scenes (ECCV) [PDF]
G Zhang, J Fan, L Chen, Z Zhang, Z Lei, L Zhang*. General Geometry-aware Weakly Supervised 3D Object Detection (ECCV) [PDF]
P Wang, Y Wang, S Li, Z Zhang, Z Lei, L Zhang. Open Vocabulary 3D Scene Understanding via Geometry Guided Self-Distillation (ECCV) [PDF]
Chang Yu, Xiangyu Zhu, Xiaomei Zhang, Zhaoxiang Zhang, Zhen Lei. Graphics Capsule: Learning Hierarchical 3D Face Representations From 2D Images (CVPR) [PDF]
Y Liu, C Luo, L Fan, N Wang, J Peng, Z Zhang*. Citygaussian: Real-time high-quality large-scale scene rendering with gaussians (ECCV) [PDF]
Z Chen, J Wu, Z Lei, Z Zhang, CW Chen. Expanding scene graph boundaries: fully open-vocabulary scene graph generation via visual-concept alignment and retention (ECCV) [PDF]
Z Song, J Zhang, Y Wang, J Fan, Z Zhang*. Enhancing Sound Source Localization via False Negative Elimination (IEEE TPAMI) [PDF]
Y Wang, J Liang, Z Zhang*. A Curriculum-style Self-training Approach for Source-Free Semantic Segmentation (IEEE TPAMI) [PDF]
C Pan, J Peng, X Bu, Z Zhang*. Large-scale object detection in the wild with imbalanced data distribution, and multi-labels (IEEE TPAMI) [PDF]
Y Li, L Fan, J He, Y Wang, Y Chen, Z Zhang, T Tan. Enhancing End-to-End Autonomous Driving with Latent World Model (ICLR) [PDF]
Y Li, L Fan, Y Liu, Z Huang, Y Chen, N Wang, Z Zhang*. Fully sparse fusion for 3d object detection (IEEE TPAMI) [PDF]
X Zhang, XY Wei, J Wu, T Zhang, Z Zhang, Z Lei, Q Li. Compositional inversion for stable diffusion models (AAAI) [PDF]
J Li, J Fan, Y Yang, S Mei, J Xiao, Z Zhang*. Fully Data-Driven Pseudo Label Estimation for Pointly-Supervised Panoptic Segmentation (AAAI) [PDF]
M Zhou, Y Wang, J Hou, S Zhang, Y Li, C Luo, J Peng, Z Zhang*. SceneX: Procedural Controllable Large-scale Scene Generation (AAAI) [PDF]
C Zhang, G Meng, B Fan, K Tian, Z Zhang, S Xiang, C Pan. Reusable architecture growth for continual stereo matching (IEEE TPAMI) [PDF]
J He, Z Huang, N Wang, Z Zhang*. Learnable Graph Matching: A Practical Paradigm for Data Association (IEEE TPAMI) [PDF]
K Ikemura, Y Huang, F Heide, Z Zhang, Q Chen, C Lei. Robust Depth Enhancement via Polarization Prompt Fusion Tuning (CVPR) [PDF]
F Zhu, Z Cheng, XY Zhang, CL Liu, Z Zhang*. RCL: Reliable Continual Learning for Unified Failure Detection (CVPR) [PDF]
J Liao, C Luo, Y Du, Y Wang, X Yin, M Zhang, Z Zhang, J Peng. HardMo: A Large-Scale Hardcase Dataset for Motion Capture (CVPR) [PDF]
B Ni, H Zhao, C Zhang, K Hu, G Meng, Z Zhang, S Xiang. Enhancing Visual Continual Learning with Language-Guided Supervision (CVPR) [PDF]
H Zhao, B Ni, J Fan, Y Wang, Y Chen, G Meng, Z Zhang*. Continual forgetting for pre-trained vision models (CVPR) [PDF]
C Pan, J Peng, Z Zhang*. Depth-Guided Vision Transformer With Normalizing Flows for Monocular 3D Object Detection (IEEE JAS) [PDF]
X Hu, Y Wang, L Fan, J Fan, J Peng, Z Lei, Q Li, Z Zhang*. Semantic anything in 3d gaussians (CoRR) [PDF]
Y Wang, J He, L Fan, H Li, Y Chen, Z Zhang*. Driving into the future: Multiview visual forecasting and planning with world model for autonomous driving (CVPR) [PDF]
Y Wang, Y Chen, X Liao, L Fan, Z Zhang*. Panoocc: Unified occupancy representation for camera-based 3d panoptic segmentation (CVPR) [PDF]
H Li, Z Wang, X Yang, Y Yang, S Mei, Z Zhang*. MemoNav: Working Memory Model for Visual Navigation (CVPR) [PDF]

2023:

Wenjian Wang, Lijuan Duan, Yuxi Wang, Junsong Fan, Zhaoxiang Zhang*. MMT: Cross Domain Few-Shot Learning via Meta-Memory Transfer (IEEE TPAMI) [PDF]
Chunfeng Song, Wanli Ouyang, Zhaoxiang Zhang*. Weakly Supervised Semantic Segmentation via Box-driven Masking and Filling Rate Shifting (IEEE TPAMI) [PDF]
Yuqi Wang, Yuntao Chen, Zhaoxiang Zhang*. Object Affinity Learning: Towards Annotation-Free Instance Segmentation (IEEE TPAMI) [PDF]
Junran Peng, Qing Chang, Haoran Yin, Xingyuan Bu, Jiajun Sun, Lingxi Xie, Xiaopeng Zhang, Qi Tian, Zhaoxiang Zhang*. GAIA-Universe: Everything is Super-Netify (IEEE TPAMI) [PDF][GitHub]
Jianjin Xu, Zhaoxiang Zhang, Xiaolin Hu. Extracting Semantic Knowledge From GANs With Unsupervised Learning (IEEE TPAMI) [PDF]
Junsong Fan, Zhaoxiang Zhang*. Toward Practical Weakly Supervised Semantic Segmentation via Point-Level Supervision (IJCV) [PDF]
Jing Li, Junsong Fan, Yuxi Wang, Yuran Yang, Zhaoxiang Zhang*. Coarse Mask Guided Interactive Object Segmentation (IEEE TIP) [PDF]
Hongxin Li, Jingran Su, Yuntao Chen, Qing Li, Zhaoxiang Zhang*. SheetCopilot: Bringing Software Productivity to the Next Level through Large Language Models (NeurIPS) [PDF][Project][GitHub]
Haochen Wang, Junsong Fan, Yuxi Wang, Kaiyou Song, Tong Wang, Zhaoxiang Zhang*. DropPos: Pre-Training Vision Transformers by Reconstructing Dropped Positions (NeurIPS) [PDF] [GitHub]
Yang Liu, Feng Wang, Naiyan Wang, Zhaoxiang Zhang*. Echoes Beyond Points: Unleashing the Power of Raw Radar Data in Multi-modality Fusion (NeurIPS) [PDF]
Lue Fan, Yuxue Yang, Yiming Mao, Feng Wang, Yuntao Chen, Naiyan Wang, Zhaoxiang Zhang*. Once Detected, Never Lost: Surpassing Human Performance in Offline LiDAR based 3D Object Detection (ICCV) [PDF][GitHub]
Yuxi Wang, Jian Liang, Yuran Yang, Shuqi Mei, Zhaoxiang Zhang*. Informative Data Mining for One-shot Cross-Domain Semantic Segmentation (ICCV) [PDF][GitHub]
Jingtao Wang, Zengjie Song, Yuxi Wang, Jun Xiao, Yuran Yang, Shuqi Mei, Zhaoxiang Zhang*. SSF: Accelerating Training of Spiking Neural Networks with Stabilized Spiking Flow (ICCV) [PDF]
Lin Zhang, Xin Li, Dongliang He, Fu Li, Errui Ding, Zhaoxiang Zhang*. LMR: A Large-Scale Multi-Reference Dataset for Reference-Based Super-Resolution (ICCV) [PDF][GitHub]
Liyi Chen, Chenyang Lei, Ruihuang Li, Shuai Li, Zhaoxiang Zhang, Lei Zhang. FPR: False Positive Rectification for Weakly Supervised Semantic Segmentation (ICCV) [PDF][GitHub]
Xiaojun Tang, Junsong Fan, Chuanchen Luo, Zhaoxiang Zhang, Man Zhang, Zongyuan Yang. DDG-Net: Discriminability-Driven Graph Network for Weakly-supervised Temporal Action Localization (ICCV) [PDF][GitHub]
Jiawei He, Yuntao Chen, Naiyan Wang, Zhaoxiang Zhang*. 3D Video Object Detection With Learnable Object-Centric Global Optimization (CVPR) [PDF][GitHub]
Pengfei Wang, Zhaoxiang Zhang, Zhen Lei, Lei Zhang. Sharpness-Aware Gradient Matching for Domain Generalization (CVPR) [PDF][GitHub]
Haochen Wang, Kaiyou Song, Junsong Fan, Yuxi Wang, Jin Xie, Zhaoxiang Zhang*. Hard Patches Mining for Masked Image Modeling (CVPR) [PDF][GitHub]
Qu Tang, Xiangyu Zhu, Zhen Lei, Zhaoxiang Zhang*. Intrinsic Physical Concepts Discovery With Object-Centric Predictive Models (CVPR) [PDF]
Chenyang Lei, Xuanchi Ren, Zhaoxiang Zhang*, Qifeng Chen. Blind Video Deflickering by Neural Filtering With a Flawed Atlas (CVPR) [PDF][GitHub][Project]
Chang Yu, Xiangyu Zhu, Xiaomei Zhang, Zhaoxiang Zhang, Zhen Lei. Graphics Capsule: Learning Hierarchical 3D Face Representations From 2D Images (CVPR) [PDF]
Yuqi Wang, Yuntao Chen, Zhaoxiang Zhang*. FrustumFormer: Adaptive Instance-aware Resampling for Multi-view 3D Detection. (CVPR) [PDF][GitHub]
Cong Pan, Yonghao He, Junran Peng, Qian Zhang, Wei Sui, Zhaoxiang Zhang*. BAEFormer: Bi-Directional and Early Interaction Transformers for Bird’s Eye View Semantic Segmentation (CVPR) [PDF]
Chenyu Yang, Yuntao Chen, Hao Tian, Chenxin Tao, Xizhou Zhu, Zhaoxiang Zhang, Gao Huang, Hongyang Li, Yu Qiao, Lewei Lu, Jie Zhou, Jifeng Dai. BEVFormer V2: Adapting Modern Image Backbones to Bird’s-Eye-View Recognition via Perspective Supervision (CVPR) [PDF][GitHub]
Shengchao Zhou, Gaofeng Meng, Zhaoxiang Zhang, Richard Yi Da Xu, Shiming Xiang. Robust Feature Rectification of Pretrained Vision Models for Object Recognition (AAAI) [PDF]

2022:

Junsong Fan, Zhaoxiang Zhang*. Memory-Based Cross-Image Contexts for Weakly Supervised Semantic Segmentation (IEEE TPAMI) [PDF][GitHub]
Chuanchen Luo, Chunfeng Song, Zhaoxiang Zhang*. Learning to Adapt Across Dual Discrepancy for Cross-Domain Person Re-Identification (IEEE TPAMI) [PDF][GitHub]
Zhaoxiang Zhang, Cong Pan, Junran Peng. Delving into the Effectiveness of Receptive Fields: Learning Scale-Transferrable Architectures for Practical Object Detection (IJCV) [PDF]
Zhaoxiang Zhang, Chuanchen Luo, Haiping Wu, Yuntao Chen, Naiyan Wang, Chunfeng Song. From Individual to Whole: Reducing Intra-class Variance by Feature Aggregation (IJCV) [PDF]
Xiaolin Hu, Chufeng Tang, Hang Chen, Xiao Li, Jianmin Li, Zhaoxiang Zhang. Improving Image Segmentation with Boundary Patch Refinement (IJCV) [PDF]
Yuchun Fang, Sirui Cai, Yiting Cao, Zhengchen Li, Zhaoxiang Zhang. Adversarial Learning Guided Task Relatedness Refinement Multi-Task Deep Learning (IEEE TMM) [PDF]
Wangli Hao, He Guan, Zhaoxiang Zhang*. VAG: A Uniform Model for Cross-Modal Visual-Audio Mutual Generation (IEEE TNNLS) [PDF]
Zhaoxiang Zhang, Yuelei Xu, Qi Cui, Qing Zhou, Linhua Ma. Unsupervised SAR and optical image matching using Siamese domain adaptation (IEEE TGRS) [PDF]
He Guan, Chunfeng Song, Zhaoxiang Zhang*, Tieniu Tan. MonoPoly: A practical monocular 3D object detector (PR) [PDF]
Qianqian Shi, Junsong Fan, Zuoren Wang, Zhaoxiang Zhang. Multimodal channel-wise attention transformer inspired by multisensory integration mechanisms of the brain (PR) [PDF]
Wenkai Dong, Zhaoxiang Zhang*, Chunfeng Song, Tieniu Tan. Identifying the key frames: An attention-aware sampling method for action recognition (PR) [PDF]
Junran Peng, Haoquan Wang, Shaolong Yue, Zhaoxiang Zhang*. Context-aware co-supervision for accurate object detection (PR) [PDF]
Yuchun Fang, Shiwei Xiao, Menglu Zhou, Sirui Cai, Zhaoxiang Zhang. Enhanced task attention with adversarial learning for dynamic multi-task CNN (PR) [PDF]
Zhaoxiang Zhang, Bin Luo, Jin Tang, Shan Yu, Amir Hussain. Editorial for Special Issue on Brain-inspired Machine Learning (Machine Intelligence Research) [PDF]
Zhaoxiang Zhang, Chenghang Wang, Jianing Song, Yuelei Xu. Object Tracking based on satellite videos: A literature review (Remote Sensing) [PDF]
Junsong Fan, Yuxi Wang, He Guan, Chunfeng Song, Zhaoxiang Zhang*. Toward few-shot domain adaptation with perturbation-invariant representation and transferable prototypes (Frontiers of Computer Science) [PDF]
Yuqi Wang, Yuntao Chen, Zhaoxiang Zhang*. 4D Unsupervised Object Discovery (NeurIPS) [PDF][GitHub]
Lue Fan, Feng Wang, Naiyan Wang, Zhaoxiang Zhang*. Fully Sparse 3D Object Detection (NeurIPS) [PDF][GitHub]
Lin Zhang, Xin Li, Dongliang He, Fu Li, Yili Wang, Zhaoxiang Zhang*. Rrsr: Reciprocal reference-based image super-resolution with progressive feature alignment and selection (ECCV) [PDF]
Yingyan Li, Yuntao Chen, Jiawei He, Zhaoxiang Zhang*. Densely constrained depth estimator for monocular 3d object detection (ECCV) [PDF][GitHub]
Chenghao Zhang, Kun Tian, Bolin Ni, Gaofeng Meng, Bin Fan, Zhaoxiang Zhang, Chunhong Pan. Stereo Depth Estimation with Echoes (ECCV) [PDF]
Junsong Fan, Zhaoxiang Zhang*, Tieniu Tan. Pointly-supervised panoptic segmentation (ECCV) [PDF][GitHub]
Zengjie Song, Yuxi Wang, Junsong Fan, Tieniu Tan, Zhaoxiang Zhang*. Self-Supervised Predictive Learning: A Negative-Free Method for Sound Source Localization in Visual Scenes (CVPR) [PDF][GitHub]
Qing Chang, Junran Peng, Lingxi Xie, Jiajun Sun, Haoran Yin, Qi Tian, Zhaoxiang Zhang*. DATA: Domain-Aware and Task-Aware Self-Supervised Learning (CVPR) [PDF][GitHub]
Tianheng Cheng, Xinggang Wang, Shaoyu Chen, Wenqiang Zhang, Qian Zhang, Chang Huang, Zhaoxiang Zhang, Wenyu Liu. Sparse Instance Activation for Real-Time Instance Segmentation (CVPR) [PDF][GitHub]
Lue Fan, Ziqi Pang, Tianyuan Zhang, Yu-Xiong Wang, Hang Zhao, Feng Wang, Naiyan Wang, Zhaoxiang Zhang*. Embracing Single Stride 3D Object Detector With Sparse Transformer (CVPR) [PDF][GitHub]
Chang Yu, Xiangyu Zhu, Xiaomei Zhang, Zidu Wang, Zhaoxiang Zhang, Zhen Lei. HP-Capsule: Unsupervised Face Part Discovery by Hierarchical Parsing Capsule Network (CVPR) [PDF]
Xinyu Zhang, Dongdong Li, Zhigang Wang, Jian Wang, Errui Ding, Javen Qinfeng Shi, Zhaoxiang Zhang, Jingdong Wang. Implicit Sample Extension for Unsupervised Person Re-Identification (CVPR) [PDF] [GitHub]
Wenjian Wang, Lijuan Duan, Yuxi Wang, Qing En, Junsong Fan, Zhaoxiang Zhang*. Remember the Difference: Cross-Domain Few-Shot Semantic Segmentation via Meta-Memory Transfer (CVPR) [PDF]
Chenghao Zhang, Kun Tian, Bin Fan, Gaofeng Meng, Zhaoxiang Zhang, Chunhong Pan. Continual Stereo Matching of Continuous Driving Scenes With Growing Architecture (CVPR) [PDF][GitHub]
Renjie Zou, Chunfeng Song, Zhaoxiang Zhang*. The Devil Is in the Details: Window-Based Attention for Image Compression (CVPR) [PDF][GitHub]
Jing Li, Junsong Fan, Zhaoxiang Zhang*. Towards Noiseless Object Contours for Weakly Supervised Semantic Segmentation (CVPR) [PDF]
Ruitong Gan, Junsong Fan, Yuxi Wang, Zhaoxiang Zhang*. Interact with Open Scenes: A Life-long Evolution Framework for Interactive Segmentation Models (ACM MM) [PDF]
Zongzhao Li, Xiangyu Zhu, Zhen Lei, Zhaoxiang Zhang. Deconfounding Physical Dynamics with Global Causal Relation and Confounder Transmission for Counterfactual Prediction (AAAI) [PDF]
Dongdong Li, Zhigang Wang, Jian Wang, Xinyu Zhang, Errui Ding, Jingdong Wang, Zhaoxiang Zhang*. Self-Guided Hard Negative Generation for Unsupervised Person Re-Identification (IJCAI) [PDF]

2021:

Qing En, Lijuan Duan, Zhaoxiang Zhang*. Joint Multisource Saliency and Exemplar Mechanism for Weakly Supervised Video Object Segmentation (IEEE TIP) [PDF]
Manyu Zhu, Dongliang He, Xin Li, Chao Li, Fu Li, Xiao Liu, Errui Ding, Zhaoxiang Zhang. Image Inpainting by End-to-End Cascaded Refinement With Mask Awareness (IEEE TIP) [PDF]
Yan Huang, Qiang Wu, Jingsong Xu, Yi Zhong, Peng Zhang, Zhaoxiang Zhang. Alleviating modality bias training for infrared-visible person re-identification (IEEE TMM) [PDF]
Yan Huang, Qiang Wu, Jingsong Xu, Yi Zhong, Zhaoxiang Zhang. Unsupervised Domain Adaptation with Background Shift Mitigating for Person Re-Identification (IJCV) [PDF]
Qu Tang, Xiangyu Zhu, Zhen Lei, Zhaoxiang Zhang*. Object dynamics distillation for scene decomposition and representation (ICLR) [PDF][GitHub]
Xingyuan Bu, Junran Peng, Junjie Yan, Tieniu Tan, Zhaoxiang Zhang*. GAIA: A Transfer Learning System of Object Detection That Fits Your Needs (CVPR) [PDF][GitHub]
Jiawei He, Zehao Huang, Naiyan Wang, Zhaoxiang Zhang*. Learnable Graph Matching: Incorporating Graph Partitioning With Deep Feature Learning for Multiple Object Tracking (CVPR) [PDF][GitHub]
Hao Tian, Yuntao Chen, Jifeng Dai, Zhaoxiang Zhang, Xizhou Zhu. Unsupervised Object Detection With LIDAR Clues (CVPR) [PDF]
Chufeng Tang, Hang Chen, Xiao Li, Jianmin Li, Zhaoxiang Zhang, Xiaolin Hu. Look Closer To Segment Better: Boundary Patch Refinement for Instance Segmentation (CVPR) [PDF]
Gang Zhang, Xin Lu, Jingru Tan, Jianmin Li, Zhaoxiang Zhang, Quanquan Li, Xiaolin Hu. RefineMask: Towards High-Quality Instance Segmentation With Fine-Grained Features (CVPR) [PDF]
Zikai Zhang, Bineng Zhong, Shengping Zhang, Zhenjun Tang, Xin Liu, Zhaoxiang Zhang. Distractor-Aware Fast Tracking via Dynamic Convolutions and MOT Philosophy (CVPR) [PDF]
Zigang Geng, Ke Sun, Bin Xiao, Zhaoxiang Zhang, Jingdong Wang. Bottom-Up Human Pose Estimation via Disentangled Keypoint Regression (CVPR) [PDF][GitHub]
Yuxi Wang, Junran Peng, ZhaoXiang Zhang*. Uncertainty-Aware Pseudo Label Refinery for Domain Adaptive Semantic Segmentation (ICCV) [PDF]
Lue Fan, Xuan Xiong, Feng Wang, Naiyan Wang, ZhaoXiang Zhang*. RangeDet: In Defense of Range View for LiDAR-Based 3D Object Detection (ICCV) [PDF][GitHub]
Yan Huang, Qiang Wu, JingSong Xu, Yi Zhong, ZhaoXiang Zhang*. Clothing Status Awareness for Long-Term Person Re-Identification (ICCV) [PDF]
Xueyi Li, Tianfei Zhou, Jianwu Li, Yi Zhou, Zhaoxiang Zhang. Group-wise semantic mining for weakly supervised semantic segmentation (AAAI) [PDF][GitHub]

2020:

Yuxi Wang, Zhaoxiang Zhang*, Wangli Hao, Chunfeng Song. Multi-Domain Image-to-Image Translation via a Unified Circular Framework (IEEE TIP) [PDF]
Yuxi Wang, Zhaoxiang Zhang*, Wangli Hao, Chunfeng Song. Attention Guided Multiple Source and Target Domain Adaptation (IEEE TIP) [PDF]
Weilun Chen, Zhaoxiang Zhang*, Xiaolin Hu, Baoyuan Wu. Boosting decision-based black-box adversarial attacks with random sign flip (ECCV) [PDF]
Junsong Fan, Zhaoxiang Zhang*, Tieniu Tan. Employing multi-estimations for weakly-supervised semantic segmentation (ECCV) [PDF]
Chuanchen Luo, Chunfeng Song, Zhaoxiang Zhang*. Generalizing person re-identification by camera-aware invariance learning and cross-domain mixup (ECCV) [PDF]
Wenkai Dong, Zhaoxiang Zhang*, Chunfeng Song, Tieniu Tan. Instance Guided Proposal Network for Person Search. IEEE Conference on Computer Vision and Pattern Recognition(CVPR) [pdf][bibtex]
Wenkai Dong, Zhaoxiang Zhang*, Chunfeng Song, Tieniu Tan. Bi-directional Interaction Network for Person Search. IEEE Conference on Computer Vision and Pattern Recognition(CVPR) [pdf][bibtex]
Junran Peng, Xingyuan Bu, Ming Sun, Zhaoxiang Zhang*, Tieniu Tan, Junjie Yan. Large-Scale Object Detection in the Wild from Imbalanced Multi-Labels. IEEE Conference on Computer Vision and Pattern Recognition(CVPR) [pdf][bibtex]
Junsong Fan, Zhaoxiang Zhang*, Chunfeng Song, Tieniu Tan. Learning Integral Objects with Intra-Class Discriminator for Weakly-Supervised Semantic Segmentation. IEEE Conference on Computer Vision and Pattern Recognition (CVPR) [pdf][bibtex]
Qi Zhang, Zhen Lei, Zhaoxiang Zhang, Stan Z. Li. Context-Aware Attention Network for Image-Text Retrieval. IEEE Conference on Computer Vision and Pattern Recognition (CVPR) [pdf][bibtex]
Junsong Fan, Zhaoxiang Zhang*, Tieniu Tan, Chunfeng Song, Jun Xiao. CIAN: Cross-Image Affinity Net for Weakly Supervised Semantic Segmentation. Thirty-Fourth AAAI Conference on Artificial Intelligence (AAAI) [pdf][bibtex]
Huanglin Yu, Ke Chen, Kaiqi Wang, Yanlin Qian, Zhaoxiang Zhang, Kui Jia. Cascading Convolutional Color Constancy. Thirty-Fourth AAAI Conference on Artificial Intelligence (AAAI) [pdf][bibtex]

Go to Top

2019:

Yan Huang, Jingsong Xu, Qiang Wu, Yi Zhong, Peng Zhang, Zhaoxiang Zhang. Beyond Scalar Neuron: Adopting Vector-Neuron Capsules for Long-Term Person Re-Identification. IEEE Transactions on Circuits and Systems for Video Technology (TCSVT) [pdf][bibtex]
Guibo Zhu, Zhaoxiang Zhang*, Jinqiao Wang, Yi Wu, Hanqing Lu. Dynamic Collaborative Tracking. IEEE Transactions on Neural Networks and Learning Systems (TNNLS). [pdf][bibtex]
Yan Huang, Jingsong Xu, Qiang Wu, Zhedong Zheng, Zhaoxiang Zhang, Jian Zhang Multi-Pseudo Regularized Label for Generated Data in Person Re-Identification. IEEE Transactions on Image Processing (TIP) [pdf][bibtex] .
Wangli Hao, Zhaoxiang Zhang*. Spatiotemporal distilled dense-connectivity network for video action recognition. Pattern Recognition (PR) [pdf][bibtex]
Wei Wang, Hao Wang, Zhaoxiang Zhang, Chen Zhang, Yang Gao. Semi-supervised domain adaptation via Fredholm integral based kernel methods. Pattern Recognition (PR) [pdf][bibtex]
Yuntao Chen, Chenxia Han, Yanghao Li, Zehao Huang, Yi Jiang, Naiyan Wang, Zhaoxiang Zhang*. SimpleDet: A Simple and Versatile Distributed Framework for Object Detection and Instance Recognition. Journal of Machine Learning Research (JMLR). [pdf][code][bibtex]
Yanghao Li, Yuntao Chen, Naiyan Wang, Zhaoxiang Zhang*. Scale-Aware Trident Networks for Object Detection. IEEE International Conference on Computer Vision (ICCV). [pdf][bibtex]
Chuanchen Luo, Yuntao Chen, Naiyan Wang, Zhaoxiang Zhang*. Spectral Feature Transformation for Person Re-Identification. IEEE International Conference on Computer Vision (ICCV). [pdf][bibtex]
Junran Peng, Ming Sun, Zhaoxiang Zhang*, Tieniu Tan, Junjie Yan. POD: Practical Object Detection with Scale-Sensitive Network. IEEE International Conference on Computer Vision (ICCV). [pdf][bibtex]
Haiping Wu, Yuntao Chen, Naiyan Wang, Zhaoxiang Zhang*. Sequence Level Semantics Aggregation for Video Object Detection. IEEE International Conference on Computer Vision (ICCV). [pdf][bibtex]
Chufeng Tang, Lu Sheng, Zhaoxiang Zhang, Xiaolin Hu. Improving Pedestrian Attribute Recognition with Weakly-Supervised Multi-scale Attribute-Specific Localization. IEEE International Conference on Computer Vision (ICCV). [pdf][bibtex]
Junran Peng, Ming Sun, Zhaoxiang Zhang*, Tieniu Tan, Junjie Yan. Efficient Neural Architecture Transformation Search in Channel-Level for Object Detection. Thirty-third Conference on Neural Information Processing Systems (NeurIPS). [pdf][bibtex]
Wenkai Dong, Zhaoxiang Zhang*, Tieniu Tan. Attention-aware Sampling via Deep Reinforcement Learning for Action Recognition. The Thirty-Third AAAI Conference on Artificial Intelligence (AAAI). [pdf][bibtex]
Qing En, Lijuan Duan, Zhaoxiang Zhang*, Xiang Bai, Yundong Zhang. Human-like Delicate Region Erasing Strategy for Weakly Supervised Detection. The Thirty-Third AAAI Conference on Artificial Intelligence (AAAI). [pdf][bibtex]

Go to Top

2018:

Zhaoxiang Zhang, Jiaxin Chen, Qiang Wu, Ling Shao. GII Representation-Based Cross-View Gait Recognition by Discriminative Projection With List-Wise Constraints. IEEE Transactions on Systems, Man, and Cybernetics (TCYB). [pdf][bibtex]
Chi Zhang, Guangqi Hou, Zhaoxiang Zhang, Zhenan Sun, Tieniu Tan. Efficient auto-refocusing for light field camera. Pattern Recognition (PR). [pdf][bibtex]
Song Bai, Shaoyan Sun, Xiang Bai, Zhaoxiang Zhang, Qi Tian. Improving context-sensitive similarity via smooth neighborhood for object retrieval. Pattern Recognition (PR). [pdf][bibtex]
Rui Yu, Zhiyong Dou, Song Bai, Zhaoxiang Zhang, Yongchao Xu, Xiang Bai. Hard-Aware Point-to-Set Deep Metric for Person Re-identification. European Conference on Computer Vision (ECCV). [pdf][bibtex]
Wangli Hao, Zhaoxiang Zhang*, He Guan. Integrating both Visual and Audio Cues for Enhanced Video Caption. The Thirty-Second AAAI Conference on Artificial Intelligence (AAAI). [pdf][bibtex]
Wangli Hao, Zhaoxiang Zhang*, He Guan. CMCGAN: A Uniform Framework for Cross-Modal Visual-Audio Mutual Generation. The Thirty-Second AAAI Conference on Artificial Intelligence (AAAI). [pdf][bibtex]
Yuntao Chen, Naiyan Wang, Zhaoxiang Zhang*. DarkRank: Accelerating Deep Metric Learning via Cross Sample Similarities Transfer. The Thirty-Second AAAI Conference on Artificial Intelligence (AAAI). [pdf][bibtex]
Yue Xu, Fei Yin, Zhaoxiang Zhang, Cheng-Lin Liu. Multi-task Layout Analysis for Historical Handwritten Documents Using Fully Convolutional Networks. International Joint Conference on Artificial Intelligence (IJCAI). [pdf][bibtex]
Liming Zhao, Mingjie Li, Depu Meng, Xi Li, Zhaoxiang Zhang, Yueting Zhuang, Zhuowen Tu, Jingdong Wang. Deep Convolutional Neural Networks with Merge-and-Run Mappings. International Joint Conference on Artificial Intelligence (IJCAI). [pdf][bibtex]

Go to Top

2017:

Ke Chen, Zhaoxiang Zhang*. Learning to Classify Fine-Grained Categories with Privileged Visual-Semantic Misalignment. IEEE Transactions on Big Data (TBD). [pdf][bibtex]
Ke Chen, Zhaoxiang Zhang*. Pedestrian Counting With Back-Propagated Information and Target Drift Remedy. IEEE Transactions on Systems, Man, and Cybernetics: Systems (TSMC). [pdf][bibtex]
Song Bai, Xiang Bai, Zhichao Zhou, Zhaoxiang Zhang, Qi Tian, Longin Jan Latecki. GIFT: Towards Scalable 3D Shape Retrieval. IEEE Transactions on Multimedia (TMM). [pdf][bibtex]
Ke Chen, Kui Jia, Zhaoxiang Zhang, Joni-Kristian Kämäräinen. Spectral attribute learning for visual regression. Pattern Recognition (PR). [pdf][bibtex]
Yuchun Fang, Zhengyan Ma, Zhaoxiang Zhang*, Xu-Yao Zhang, Xiang Bai. Dynamic Multi-Task Learning with Convolutional Neural Network. International Joint Conference on Artificial Intelligence (IJCAI). [pdf][bibtex]
Guibo Zhu, Zhaoxiang Zhang*, Xu-Yao Zhang, Cheng-Lin Liu. Diverse Neuron Type Selection for Convolutional Neural Networks. International Joint Conference on Artificial Intelligence (IJCAI). [pdf][bibtex]
Gangming Zhao, Jingdong Wang, Zhaoxiang Zhang*. Random Shifting for CNN: a Solution to Reduce Information Loss in Down-Sampling Layers. International Joint Conference on Artificial Intelligence (IJCAI). [pdf][bibtex]

Go to Top

2016:

Jie Qin, Li Liu, Zhaoxiang Zhang, Yunhong Wang, Ling Shao. Compressive Sequential Learning for Action Similarity Labeling. IEEE Transactions on Image Processing (TIP). [pdf][bibtex]
Song Bai, Shaoyan Sun, Xiang Bai, Zhaoxiang Zhang, Qi Tian. Smooth Neighborhood Structure Mining on Multiple Affinity Graphs with Applications to Context-Sensitive Similarity. The 14th European Conference on Computer Vision (ECCV). [pdf][bibtex]
Song Bai, Xiang Bai, Zhichao Zhou, Zhaoxiang Zhang, Longin Jan Latecki. GIFT: A Real-Time and Scalable 3D Shape Search Engine. IEEE Conference on Computer Vision and Pattern Recognition (CVPR). [pdf][bibtex]

Go to Top

Zhaoxiang Zhang (张兆翔)

Publications

Prof. Zhaoxiang Zhang

Selected Publications

What is new

Opening Positions