
2024年大数据最新数据库系统工程师笔记(一)计算机系统,2024年最新最新2024年大数据开发大厂面试经验
包含在指令中是立即寻址,操作数的地址包含在指令中是直接寻址。
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
包含在指令中是立即寻址,操作数的地址包含在指令中是直接寻址。
1.8计算机硬件的典型结构
单总线结构、双总线结构、采用通道的大型系统结构。
1.9CPU由运算器和控制器组成
控制器由程序计数器(PC)、指令寄存器(IR)、指令译码器(ID)、状态条件寄存器、时序产生器和微操作信号发生器组成。
PC: pc自动增加一个值,指向下一条要执行的指令,当程序转移时将转移地址送入PC。
IR:用于存放当前要执行的指令。
ID:对现行的指令进行分析,确定指令类型、指令要完成的操作和寻址方式。
1.10指令执行的过程
取指令:控制器首先按程序计数器所指出的指令地址从内存中取出一条指令。
指令译码:将指令的操作码部分送入指令译码器中进行分析,然后根据指令的功能发出控制命令。
按指令操作码执行。
形成下一条指令地址。
1.11CPU的基本功能
程序控制
操作控制
时间控制
数据处理——CPU的根本任务
1.12计算机体系结构和计算机组成的区别
体系结构要解决的问题是计算机系统在总体上、功能上需要解决的问题,而计算机组成要解决的是逻辑上如何具体实现的问题。
1.13计算机体系结构分类(指令流、数据流、多倍性)
Flynn分类:传统的顺序执行的计算机在同一时刻只能执行一条指令(即只有一个控制流)、处理一个数据(即只有一个数据流),因此被称为单指令流单数据流计算机Single Instruction Single Data即SISD计算机)。而对于大多数并行计算机而言,多个处理单元都是根据不同的控制流程执行不同的操作,处理不同的数据,因此,它们被称作是多指令流多数据流计算机,即MIMD(Multiple Instruction Multiple Data)计算机。曾经在很长一段时间内成为超级并行计算机主流的向量计算机除了标量处理单元之外,最重要的是具有能进行向量计算的硬件单元。在执行向量操作时,一条指令可以同时对多个数据(组成一个向量)进行运算,这就是单指令流多数据流(Single Instruction Multiple Data,SIMD)的概念。因此,我们将向量计算机称为SIMD计算机。第四种类型即所谓的多指令流单数据(MultipleInstructionSingleData)计算机。在这种计算机中,各个处理单元组成一个线性阵列,分别执行不同的指令流,而同一个数据流则顺次通过这个阵列中的各个处理单元。这种系统结构只适用于某些特定的算法。相对而言,SIMD和MISD模型更适合于专用计算。在商用并行计算机中,MIMD模型最为通用,SIMD次之,而MISD最少用。
1.14存储器的分类
按存储器的位置:内存(主存)和外存(辅存)。
按存储器的材料:磁存储器、半导体存储器(静态和动态)和光存储器。
按工作方式:读写存储器和只读存储器。只读存储器(ROM/PROM/EPROM/EEPROM/闪存)
按访问方式:按地址访问的存储器和按内容访问的存储器(相连存储器)。
按寻址方式:随机存储器(RAM)、顺序存储器(ASM)—磁带、直接存储器(DAM)—磁盘就是直接存储器。
1.15输入/输出
直接程序控制、中断方式、直接存储器存取(DMA)。
1.16流水线技术
流水线周期:各子任务中执行时间最长的(最慢的)的子任务执行时间Tn=执行一条指令的所需时间+(n-1)*流水线周期
吞吐率和建立时间是流水线技术的两个重要技术指标。吞吐率是指单位时间内流水线处理机流出的结果数;流水线开始工作经过一段时间(建立时间)才能到达最大的吞吐率。若m个子过程所用的时间都是t0则建立时间是 m*t0,否则t0取子过程中的最长时间。那么n条指令执行完成需要的时间为第一条完全执行的时间加上后n-1条所用的时间(n-1)mt0。
1.17虚拟存储器
页式:页表硬件少,查表速度快,主存零头少;分页无逻辑性,不利于存储保护。
段式:优点是:段的界限分明;支持序的模块化设计;易于对的译改和保护便于多道程序的共享。主要缺点,因段的长度不一,主存利用率不高,产生大内存碎片,造成浪费:段表庞大,查表速度慢。
段页式:地址变换速度比较慢。
1.18指令特点
只有20%的指令经常应用频率达80%→RISC(精简指令集计算机)简化了CPU的控制器,提高了处理速度,特点有:
指令种类少。一般只有十几到几十条简单的指令。
指令长度固定,指今格式少。这可使指译码更加简单。
寻址方式少。适合于组合逻辑控制器,便于提高速度。
设置最少的访内指令。访问内存比较花时间,尽少用。
在 CPU内部设大的存器使大多数作在速很的CPU内部进行。
非常适合水线操作。由于指简单,并行行就更易实现。
1.19信息安全的基本要素
机密性:确保信息不给未授权的实体或进程。
完整性:只有得到允许的人才能修改数据能够别数否已被改。
可用性:得到授权的实体在需要时可访问数据。
可控性可以控制授权范围内的信息流向及行为方式。
可审性:对出现的安全问题提供调查的依据和手段。
1.20计算机安全等级
(技术安全性、管理安全性、政策法律安全性):分为四组七个等级。
1.21计算机病毒的特点
寄生性
隐蔽性
非法性
传染性
破坏性
1.22计算机病毒的类型
系统引导型病毒————BOOT型病毒
文件外壳型病毒————攻击command.com文件
混合型病毒————Flip病毒、One Half病毒(幽灵)
目录型病毒————改变目录项不敢变相关文件
宏病毒————用宏的word或是excel文件
1.23计算机可靠性
1.24计算机可靠模型
1.25对称加密技术
加密密钥和解密密钥相同
DES(数据加密标准算法):采用替换和移位方法加密,用56位进行对64位数据加密(也就是说只有56是有效的),每次加密对64位数据进行16次的编码,密钥长度为64位。它加密速度快,密钥容易产生。由于DES的密钥较短,不能抵抗对密钥的穷举搜索攻击。
RC-5算法。
IDEA算法:明文和密文的长度都为64位,密钥为128位。
1.26非对称加密技术
运用公钥加密和私钥解密
RSA算法:RAS技术是指可靠性(R)、可用性(A)、可维性(S)
信息摘要是一个单向散列函数,经过散列函数得到一个固定的散列值,常用的信息摘要算法有MD5、SHA算法,散列值分别为128和160位。
数字签名:用私钥进行加密用公钥解密。
数字时间戳技术:电子商务安全服务项目之一,能提供电子文件的日期和时间信息的安全保护。它是在数据加密上加上了时间,有摘要、文件的日期和时间及数据签名组成。
1.27信息传输加密
链路加密:对传输途径进行加密
节点加密
端到端加密
1.28SSL安全协议
主要应用于提高应用程序之间数据的安全系数。提供的服务有:
用户和服务器的合法性认证。
加密数据以隐藏被传送的数据。
保护数据的完整性。
1.29DES与RAS的比较
DES 是对称密钥密码算法,它的加密密钥和解密密钥是相同的。RSA 是非对称密钥密码算法,它使用不同的密销分别用于加密和解密数据,还可以用于数字签名。对称密钥密码算法的效率要比非对称密钥密码算法高很多,适用于对文件等大量的数据进行加密。
1.30计算机故障诊断技术
计算机的故障:
永久性故障
间隙性故障
瞬时性故障
1.31内存容量
内存容量=末地址-首地址+1
1.32存储相关计算问题
计算磁道数:磁道数 = (外半径-内半径)×道密度×记录面数。注:硬盘的第一面和最后一面是保护用的要减掉,即有n个双面的盘片记录面数为n×2-2。
非格式化磁盘容量:容量=位密度×π×最内圈直径×总磁道数。注:每道位密度是不通的,但是容量是相同的,其中0道是最外面的磁道位密度最小。
格式化磁盘容量:容量=每道扇区数×扇区容量×总磁道数。
(格式化)平均数据传输率:传输率=每道扇区数×扇区容量×盘片转速。
存取时间=寻道时间﹢等待时间。其中:寻道时间是指磁头移动所需的时间;等待时间为等待读写的扇区转到磁头下方所需的时间。
(非格式化)平均数据传输率:传输率=最内直径×π(3.14)×位密度×盘片转速。注:一般采用非格式化。
1.33数制运算
1.34码制
反码:正数的反码与原码相同,负数反码为原码按位取反(符号位不变)。
补码:正数的补码与原码相同,负数的补码为反码末位加1(即除去符号位按位取反末位加1)。
移码(增码):将补码的符号位求反。
[X + Y ]补= [X]补+ [Y ]补
[X - Y ]补= [X]补- [Y ]补
[ - Y ]补= - [Y ]补
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!
由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新
.(img-5KZuPLkB-1715270804021)]
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!
由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新
更多推荐
所有评论(0)