爆裂云:一个事件驱动的、基于云的CRISPR-Cas9引导RNA设计工具
原标题:Crackling Cloud: an event-driven, cloud-based CRISPR-Cas9 guide RNA design tool
5 分
关键词
摘要
基因编辑已经被CRISPR-Cas9技术彻底改变。该技术的多功能性和易用性远远超过其前辈,然而,选择高质量的引导RNA(gRNA)对于将其引导至目标位点至关重要。选择gRNA需要高性能算法来评估在目标和非目标位点的核酸酶活性。虽然有一套可用的程序,但许多程序在分析最大基因组时遇到困难,或者其预测准确性较低。我们之前发布了一款名为Crackling的程序,它是目前最快和最准确的工具之一,但需要终端用户能够访问传统的高性能计算环境。在这里,我们介绍了Crackling的一个改编版本,名为Crackling Cloud,它利用了现代无服务器云技术,这些技术广泛可供任何人使用,并且在空闲时不消耗资源和产生成本,但在分析需要时可以扩展使用大量资源。Crackling Cloud作为一个模板化解决方案,使用了亚马逊网络服务(Amazon Web Services)的技术,并在GitHub上免费提供,遵循BSD 3条款许可证:https://github.com/bmds-lab/Crackling-AWS
AI理解论文

该文档介绍了一种名为Crackling Cloud的现代化CRISPR-Cas9引导RNA(gRNA)设计工具。该工具利用云计算技术,特别是事件驱动的无服务器架构,以提高可用性和可扩展性。以下是对该文档的详细总结:
引言
CRISPR-Cas9技术因其简单性和低成本,已成为基因编辑的金标准。其核心在于通过引导RNA(gRNA)引导核酸酶在目标基因组位置引入双链DNA断裂,从而实现精确的基因编辑。然而,选择高质量的gRNA至关重要,这需要高性能算法来评估gRNA在目标和非目标位点的活性。传统的gRNA设计工具通常依赖于高性能计算环境,这对普通用户来说可能不够友好。
Crackling Cloud的创新
Crackling Cloud是对之前发布的Crackling程序的改编,后者以其速度和准确性著称,但需要传统的高性能计算环境。Crackling Cloud通过利用现代无服务器云技术,提供了一种模板化的解决方案,用户可以在自己的云环境中部署该软件。其设计旨在减少闲置时的成本,并在需要时扩展以使用大量资源。
方法
Crackling Cloud采用了AWS(Amazon Web Services)的技术,使用AWS Cloud Development Kit构建,提供了预先安全的、专用的资源。其架构包括API端点、函数计算(Lambda)、数据库表、对象存储(S3)和消息队列(SQS)。这些组件通过事件驱动的方式协同工作,确保在没有任务时不消耗资源。
-
数据处理流程:当作业提交到数据库后,Lambda函数检查指定的基因组是否可用。如果不可用,则从NCBI基因组数据库中查询并下载。对于大于50MB的基因组,下载过程被分割为多个部分,以提高效率。
-
gRNA提取与评估:使用正则表达式模式从基因序列中提取候选gRNA。每个候选gRNA被添加到两个队列中:一个用于评估目标活性,另一个用于评估非目标活性。Lambda函数分别处理这些任务。
-
异步设计:提供第三个API端点以获取进度更新。评估完成后,结果写入数据库,可通过API或Web客户端获取。
结果与讨论
Crackling Cloud在速度和准确性方面表现优异。其运行时间从API提交作业到完成评估,包括下载和处理基因组的时间。实验表明,Crackling Cloud能够在69秒内分析1000个gRNA,在3.5分钟内分析10000个gRNA。
结论
Crackling Cloud通过利用云计算的无限扩展性,解决了传统gRNA设计工具在处理大基因组时的局限性。其无服务器模型减少了闲置成本,并简化了软件开发过程。用户可以在自己的云环境中部署该工具,确保数据隐私和安全。
专业术语解释
- CRISPR-Cas9:一种基因编辑技术,利用RNA引导的核酸酶在特定基因组位置引入双链断裂。
- gRNA(引导RNA):引导CRISPR-Cas9系统到特定基因组位置的RNA序列。
- 无服务器架构:一种云计算模型,用户无需管理服务器,资源按需分配。
- AWS Lambda:一种无服务器计算服务,自动管理计算资源。
- S3(Simple Storage Service):AWS提供的对象存储服务。
- SQS(Simple Queue Service):AWS提供的消息队列服务,用于任务调度。
通过这种创新的云架构,Crackling Cloud为gRNA设计提供了一种高效、可扩展且用户友好的解决方案。
Chat Paper
当前问答基于全文