内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • 分布式数据库基础:分布式数据库故障

    点击并拖拽以移动 分布式数据库系统常见的故障主要有事务故障、系统故障、介质故障、网络引起的故障。 事务故障:计算溢出、完整性破坏、操作员干预、输入输出报错等。 介质故障:存放数据的介质发生的故障,比如磁盘、磁盘的损坏等等。 系统故障:CPU出错、死循环、缓冲区满了、系统崩溃等等。

    作者: IT技术分享社区
    发表时间: 2023-01-30 14:15:21
    58
    0
  • 分布式存储(ceph)的scrub功能验证

    通过手动触发的方式去验证scrub能力:找一个OSD目录:ls /var/lib/ceph/osd/ceph-5/current/pg 121.e9 删掉一个文件:手动执行:ceph pg scrub 121.e9检测结果:手动执行修复ceph pg repair 121.e9连续监控

    作者: eter
    548
    1
  • 【ModelArts】【训练作业】分布式训练无法init()

    得鹏城实验室昇腾环境。在实验室训练作业模块下,选择Ascend: 8 * Ascend-910 CPU:192 核 2048G在翻阅官方分布式训练的教程文档后https://www.mindspore.cn/docs/programming_guide/zh-CN/r1.3/use_on_the_cloud

    作者: lmhabc
    3662
    4
  • 了解ModelArts高性能分布式训练优化点

    ModelArts高性能分布式训练优化点自动混合精度训练(充分发挥硬件计算能力)动态超参调整技术(动态 batch size、image size、momentum 等)模型梯度的自动融合、拆分基于BP bubble自适应的计算,通信算子调度优化分布式高性能通信库(nstack、

    作者: 建赟
    1586
    2
  • 华为智能分布式接入网应用案例

    作者: 柠檬PH=2
    628
    4
  • 分布式存储慢盘模拟及监控(ceph)

    存储集群配置7200转硬盘,更换其中一块为5900转的硬盘模拟慢盘观察ceph性能相关统计插入一块 5900rpm 硬盘模拟慢盘:vdbench 对存储集群打上背景压力:iostat,可见性能差的盘“sdn”占用率较高,优先达到瓶颈,会影响整体性能同时观察osd延时,sdn(osd

    作者: eter
    906
    0
  • 分布式缓存服务 里面的 缓存分析?

    分布式缓存服务  里面的  缓存分析?

    作者: rencai
    827
    1
  • GaussDB分布式数据库调优方法

    询优化、资源管理​​的系统工程。本文将从核心调优方向出发,总结GaussDB分布式数据库的性能优化方法论与实践经验。一、理解GaussDB的底层架构:调优的前提GaussDB的分布式架构是其性能的基石,调优前需明确其核心组件与数据流动逻辑:​​计算节点(CN,Coordinator

    作者: Gauss松鼠会小助手2
    101
    6
  • 【论文分享】车联网中安全认证技术的分析与研究

    OBU的准确认证,甚至使系统瘫痪,在提高认证速率的同时没有考虑安全性;基于区块链的快速匿名身份认证方案能有效利用区块链技术的防篡改、分布式特性实现高效的安全认证,但其安全性过度依赖存入同一区块链的车辆身份信息,没有考虑未来不同品牌车辆可能会有不同的区块链,没有加入更多的可信第三方

    作者: 乔天伊
    439
    8
  • 分布式数据库中间件如何创建一个分布式数据库 ?

    Middleware)专注于解决数据库分布式扩展问题,突破了传统数据库的容量和性能瓶颈,实现海量数据高并发访问。华为云控制台提供一键式申请DDM实例,以及建库建表等操作,帮助用户省去运维烦恼。 </p><p>本指南以创建并连接一个分布式数据库为例,指导您快速上手分布式数据库中间件服务。包括申请

    作者: 云彩飞扬
    6291
    0
  • 分布式训练Allreduce算法

    现在的模型以及其参数愈加复杂,仅仅一两张的卡已经无法满足现如今训练规模的要求,分布式训练应运而生。 分布式训练是怎样的?为什么要使用Allreduce算法?分布式训练又是如何进行通信的?本文就带你了解大模型训练所必须的分布式训练Allreduce算法。 通信概念 我们理解计算机的算法都是基

    作者: 我抽签必中
    发表时间: 2021-05-24 07:26:15
    10618
    0
  • 请你讲讲分布式系统分布式环境中的数据是如何管理的?

    理。 (2) 应用 ① 另一种心跳检测机制:检测系统和被检测系统之间并不直接关联起来,而是通过ZK上某个节点关联,大大减少系统耦合。 ② 另一种系统调度模式:某系统由控制台和推送系统两部分组成,控制台的职责是控制推送系统进行相应的推送工作。管理人员在控制台作的一些操作,实际

    作者: Java小叮当
    发表时间: 2022-03-30 15:04:21
    600
    0
  • ModelArts云上环境多卡分布式训练时asnumpy报错

    Engine | mindspore_1.7.0-cann_5.1.0-py_3.7-euler_2.8.3-aarch64错误描述多卡分布式训练时,任何Tensor.asnumpy的调用都会报错。报错信息- Case 1[ERROR] DEVICE(222,ffffb7464010

    作者: yd_293128151
    120
    2
  • 什么是分布式防火墙?

    滤和控制。 2.3 分布式日志与监控 分布式防火墙还包括一个分布式的日志记录和监控系统。每个数据平面节点会记录与其相关的流量日志,并将这些日志集中到一个中央管理系统中。这种集中管理的日志系统允许管理员全面监控网络活动,并且能够快速响应安全事件。 3. 分布式防火墙的关键优势 3

    作者: wljslmz
    发表时间: 2024-08-23 17:30:26
    100
    0
  • 跨链去中心化云计算如何抢传统云计算市场?

    os等主流区块链桥接,为这些桥接的区块链带去可扩展的计算服务和Layer-2预言机服务等,有效解决可扩展性问题,让交易速度更快、成本更低。这意味着像DeFi、NFT这样的区块链应用和服务将可以大幅提高性能。  值得一提的是,不同于许多分布式计算网络,兼具云计算与区块链思维的CUD

    作者: 风起云涌1
    880
    0
  • 【mindspore产品】【8卡分布式训练】davinci_model : load task fail, return ret

    【功能模块】8卡分布式训练失败,出现HCCL错误。【操作步骤&问题现象】1、模型为3D卷积模型,分布式相关设置。2、出现HCCL报错,Distribute Task Failed。注意:数据处理需要40分钟。【截图信息】1. 报错信息ERROR] GE(1530736,ffff4809f1e0

    作者: winnuix
    5182
    3
  • 浅谈Redis实现分布式

    Redis实现分布式锁 2.1 为什么要引入分布式锁? 因为集群环境下,无法避免要把一个项目部署成多个节点,但是数据的一致性导致每个节点访问的数据都是一样的,至此我们可以把每一个项目节点都当做一个线程,整个分布式集群当做一个进程,数据就是多个节点共享的资源,因此难免会引发分布式环境下的多线程问题。

    作者: Barry Yan
    发表时间: 2022-10-16 14:08:46
    180
    0
  • 浅谈LLM之分布式训练

    策略、模型架构、内存优化、计算优化等一系列的技术。本节将介绍分布式机器学习系统的基础概念、分布式训练集群架构、分布式训练并行策略,并以DeepSpeed 为例介绍如何在集群上训练大语言模型。 一、分布式训练概述 分布式训练(Distributed Training)是指将机器学习

    作者: 码上开花_Lancer
    发表时间: 2024-09-20 17:50:01
    74
    0
  • 基于redis实现分布式

    if redis.call('get', KEYS[1]) == ARGV[1] then return redis.call('del', KEYS[1]) else return 0 end 点击并拖拽以移动 代码实现: public void checkAndLock()

    作者: yd_249383650
    发表时间: 2023-05-23 09:54:58
    37
    0
  • 2021年数十个技术领域图谱曝光,包含Golang、区块链、人工智能、架构师等领域学习路线

    前言:不知道你是否和我一样,刚开始学习某个技术领域的时候缺乏坚持的动力,没有一个清晰的学习路线,学习的过程中没有人指导,遇到问题没人一起解答,想深入学习某个领域而又无从下手,不知道该从何处学起?这不,你想要的技术图谱来啦。有了这款武功秘籍,不光能开阔视野,提升自己的认知,还能在学

    作者: 孙叫兽
    发表时间: 2021-03-26 00:15:10
    2287
    0