长垣产业园区科技文献服务平台 | cy.gmachineinfo.com | 全球机械文献资源网

长垣产业园区科技文献服务平台

会议文集

文集名	AAAI Special Track (Safe, Robust and Responsible AI Track)
会议名	38th AAAI Conference on Artificial Intelligence (AAAI-24), 36th Conference on Innovative Applications of Artificial Intelligence (IAAI-24), 14th Symposium on Educational Advances in Artificial Intelligence (EAAI-24)
中译名	《第三十八届AAAI人工智能会议，第三十六届人工智能创新应用会议，第十四届人工智能教育进展讨论会，卷19-2》
机构	Association for the Advancement of Artificial Intelligence (AAAI)
会议日期	20-27 February 2024
会议地点	Vancouver, Canada
出版年	2024
馆藏号	354023

题名

作者

出版年

Enumerating Safe Regions in Deep Neural Networks with Provable Probabilistic Guarantees

Luca Marzari; Davide Corsi; Enrico Marchesini; Alessandro Farinelli; Ferdinando Cicalese

2024

Divide-and-Aggregate Learning for Evaluating Performance on Unlabeled Data

Shuyu Miao; Jian Liu; Lin Zheng; Hong Jin

2024

SentinelLMs: Encrypted Input Adaptation and Fine-Tuning of Language Models for Private and Secure Inference

Abhijit Mishra; Mingda Li; Soham Deo

2024

Safeguarded Progress in Reinforcement Learning: Safe Bayesian Exploration for Control Policy Synthesis

Rohan Mitta; Hosein Hasanbeig; Jun Wang; Daniel Kroening; Yiannis Kantaros; Alessandro Abate

2024

Feature Unlearning for Pre-trained GANs and VAEs

Saemi Moon; Seunghyuk Cho; Dongwoo Kim

2024

Reward Certification for Policy Smoothed Reinforcement Learning

Ronghui Mu; Leandro Soriano Marcolino; Yanghao Zhang; Tianle Zhang; Xiaowei Huang; Wenjie Ruan

2024

EncryIP: A Practical Encryption-Based Framework for Model Intellectual Property Protection

Xin Mu; Yu Wang; Zhengan Huang; Junzuo Lai; Yehong Zhang; Hui Wang; Yue Yu

2024

Neural Closure Certificates

Alireza Nadali; Vishnu Murali; Ashutosh Trivedi; Majid Zamani

2024

SocialStigmaQA: A Benchmark to Uncover Stigma Amplification in Generative Language Models

Manish Nagireddy; Lamogha Chiazor; Moninder Singh; Ioana Baldini

2024

MaxEnt Loss: Constrained Maximum Entropy for Calibration under Out-of-Distribution Shift

Dexter Neo; Stefan Winkler; Tsuhan Chen

2024

ORES: Open-vocabulary Responsible Visual Synthesis

Minheng Ni; Chenfei Wu; Xiaodong Wang; Shengming Yin; Lijuan Wang; Zicheng Liu; Nan Duan

2024

Q-SENN: Quantized Self-Explaining Neural Networks

Thomas Norrenbrock; Marco Rudolph; Bodo Rosenhahn

2024

Understanding Likelihood of Normalizing Flow and Image Complexity through the Lens of Out-of-Distribution Detection

Genki Osada; Tsubasa Takahashi; Takashi Nishide

2024

Adversarial Initialization with Universal Adversarial Perturbation: A New Approach to Fast Adversarial Training

Chao Pan; Qing Li; Xin Yao

2024

A PAC Learning Algorithm for LTL and Omega-Regular Objectives in MDPs

Mateo Perez; Fabio Somenzi; Ashutosh Trivedi

2024

Robust Stochastic Graph Generator for Counterfactual Explanations

Mario Alfonso Prado-Romero; Bardh Prenkaj; Giovanni Stilo

2024

Visual Adversarial Examples Jailbreak Aligned Large Language Models

Xiangyu Qi; Kaixuan Huang; Ashwinee Panda; Peter Henderson; Mengdi Wang; Prateek Mittal

2024

Dissenting Explanations: Leveraging Disagreement to Reduce Model Overreliance

Omer Reingold; Judy Hanwen Shen; Aditi Talati

2024

I-CEE: Tailoring Explanations of Image Classification Models to User Expertise

Yao Rong; Peizhu Qian; Vaibhav Unhelkar; Enkelejda Kasneci

2024

A Simple and Practical Method for Reducing the Disparate Impact of Differential Privacy

Lucas Rosenblatt; Julia Stoyanovich; Christopher Musco

2024

1

国家科技图书文献中心全球文献资源网京ICP备05055788号-26 京公网安备11010202008970号机械工业信息研究院 2018-2024