资源中心

Resource Center

首页 » 资源中心 » 公共数据库 » UniProt检索指南
UniProt检索指南
发布时间:2025-10-21    点击:139


1. 高效搜索与过滤(关键词检索技巧)

  • 精准关键词:在搜索框中输入特定的基因或蛋白质名称(如 TP53)或 Uniprot ID(如 P04637)。如果名称较为通用(如 kinase),建议添加物种名称(如 human)或功能描述(如 DNA-binding)以缩小范围。

  • 利用过滤器:搜索结果页左侧的 Filters 非常强大,可以快速筛选出 Review 版(Swiss-Prot)或未 Review 版(TrEMBL),也可以按亚细胞定位、分子功能等属性筛选。

  • 高级检索:UniProt 支持构建复合检索(Advanced Search),可使用布尔逻辑运算符 AND、OR、NOT 连接多个搜索条件。例如,查找人类(human)且具有“kinase”功能的蛋白质。

2. 批量操作与分析(篮子功能)

  • 使用“Basket”功能:如果您需要对多个蛋白质进行分析(如 BLAST、比对或 ID 映射),不要一个一个点进去。勾选搜索结果中的条目,点击页面顶部的 “Add to basket” 按钮,即可将它们添加到“篮子”中进行批量操作。

3. 常用工具(BLAST/Align/Retrieve)

  • BLAST 比对:UniProt 提供的 BLAST 工具针对其收录的蛋白质序列进行了优化。可以输入序列或 ID,搜索相似蛋白质以推断功能或进化关系。

  • 多序列比对(Align)‍:支持 Clustal Omega 算法,适合进行保守区分析。特别适用于分析同一家族蛋白的保守结构域时使用。

  • ID Mapping:UniProt 的 ID Mapping 工具非常强大,支持将 UniProt ID 批量转换为 Ensembl、RefSeq、PDB 等其他数据库的 ID,适合进行交叉数据库分析。

4. 数据下载与 API 调用

  • 下载全库数据:如果需要离线分析,可以通过 UniProt 官方网站提供的 FTP 站点下载完整数据库(如 UniProtKB/Swiss-Prot、TrEMBL)。

  • API 编程:对于 Python 用户,UniProt 提供了 RESTful API 接口。可以通过简单的 HTTP 请求,获取蛋白质的序列、注释、结构信息等,实现自动化的数据挖掘。