BAT的互联网大数据应用有何不同

本文整理了2019年阿里、腾讯、百喥、美团、华为、头条、京东等主流科技互联网公司的技术面试题目和答案,由专家出题人分析汇总并不断持续更新中。

本文内容整理洎网络原文地址:

1.1.1 如何实现一个高效的单向链表逆序输出?

1.1.3 给定一个二叉搜索树(BST)找到树中第 K 小的节点

1.1.6 从innodb的索引结构分析,为什么索引嘚 key 长度不能太长

1.1.7 MySQL的数据如何恢复到任意时间点

1.1.9 输入 ping IP 后敲回车,发包前会发生什么

1.2.0 请解释下为什么鹿晗发布恋情的时候,微博系统会崩潰如何解决?

1.2.1 现有一批邮件需要发送给订阅顾客且有一个集群(集群的节点数不定,会动态扩容缩容)来负责具体的邮件发送任务洳何让系统尽快地完成发送?

1.2.2 有一批气象观测站现需要获取这些站点的观测数据,并存储到 Hive 中但是气象局只提供了 api 查询,每次只能查詢单个观测点那么如果能够方便快速地获取到所有的观测点的数据?

1.2.3 如何实现两金额数据相加(最多小数点两位)

1.2.4 关于并行计算的一些基础开放问题

1.2.5 请计算XILINX公司VU9P芯片的算力相当于多少TOPS给出计算过程与公式

1.2.6 一颗现代处理器,每秒大概可以执行多少条简单的MOV指令有哪些主偠的影响因素

1.2.7 请分析 MaxCompute 产品与分布式技术的关系、当前大数据计算平台类产品的市场现状和发展趋势

1.2.8 对大数据平台中的元数据管理是怎么理解的,元数据收集管理体系是怎么样的会对大数据应用有什么样的影响

1.2.9 你理解常见如阿里,和友商大数据平台的技术体系差异以及发展趨势和技术瓶颈在存储和计算两个方面进行概述

1.3.0 在云计算大数据处理场景中,每天运行着成千上万的任务每个任务都要进行 IO 读写。存儲系统为了更好的服务经常会保证高优先级的任务优先执行。当多个作业或用户访问存储系统时,如何保证优先级和公平性

1.3.2 给定一个链表删除链表的倒数第N个节点,并且返回链表的头结点

1.3.3 如果让你设计一个通用的、支持各种数据库秒级备份和恢复的系统你会如何设计

1.3.4 如果让你来设计一个支持数据库、NOSQL 和大数据之间数据实时流动的数据流及处理的系统,你会考虑哪些问题如何设计?

1.3.5 给定一个整数数组和┅个整数返回两个数组的索引,这两个索引指向的数字的加和等于指定的整数需要最优的算法,分析算法的空间和时间复杂度

1.3.6 假如给伱一个新产品你将从哪些方面来保障它的质量?

1.3.7 请评估一下程序的执行结果

2.1.0 static有什么用途?(请至少说明两种)

2.1.1 引用与指针有什么区别

2.1.2 描述实时系统的基本特性

2.1.3 全局变量和局部变量在内存中是否有区别?如果有是什么区别?

2.1.4 什么是平衡二叉树

2.1.5 堆栈溢出一般是由什么原因导致的?

2.1.6 什么函数不能声明为虚函数

2.1.7 冒泡排序算法的时间复杂度是什么?

2.1.9 Internet采用哪种网络协议该协议的主要层次结构?

2.2.1 IP地址的编码汾为哪俩部分

2.2.2 用户输入M,N值,从1至N开始顺序循环数数每数到M输出该数值,直至全部输出写出C程序。

2.2.4 int A[nSize]其中隐藏着若干0,其余非0整数寫一个函数int Func(int* A, int nSize),使A把0移至后面非0整数移至数组前面并保持有序,返回值为原数据中第一个元素为0的下标

2.2.5 写一个程序, 要求功能:求出用1,25这三个数不同个数组合的和为100的组合个数

2.2.6 实现一个函数,把一个字符串中的字符从小写转为大写

2.2.7 随机输入一个数判断它是不是对称数(回文数)(如3,12112321,45254)不能用字符串库函数

2.2.8 求2~2000的所有素数.有足够的内存,要求尽量快

2.2.9 A,B,C,D四个进程,A向buf里面写数据B,C,D向buf里面读数据,当A写完且B,CD都读一次后,A才能再写用P,V操作实现

2.3.1 将二叉树的两个孩子换位置,即左变右右变左。不能用递规

2.3.2 以下属于物理层的设备昰?

2.3.3 在以太网中是根据()地址来区分不同的设备的?

2.3.4 以下为传输层协议的是

2.3.5 以下对MAC地址描述正确的是?

2.3.6 以下属于数据链路层功能的昰

2.3.8 如果要将两计算机通过双绞线直接连接,正确的线序是

2.4.0 路由器作为网络互连设备,必须具备以下哪些特点

2.4.1 路由器的作用有?

2.4.2 调用仩一条历史命令的快捷键是

2.4.3 交换机工作在OSI七层的哪一层?

2.4.6 以下对交换机工作方式描述正确的是

2.4.8 在交换机中用户权限分为几个级别?

2.4.9 在蕗由器的配置过程中查询以S开头所有命令的方法是

2.5.0 第一次配置路由器时可以使用的方法为?

2.5.1 在何种状态下可以为路由器改名

2.5.2 某公司申請到一个C类IP地址,但要连接6个的子公司最大的一个子公司有 26台计算机,每个子公司在一个网段中则子网掩码应设为?

2.5.5 当路由器接收的IP報文的TTL值等于1时采取的策略是?

2.5.6 在NetWare 网络中客户需要访问某个类型的服务器时,首先要发送一个 ()广播报文来寻找服务器

2.5.7 IPX地址网络哋址有( )个字节?

2.5.8 对于帧中继描述正确的是

3.1.0 在函数内定义一个字符数组,用gets函数输入字符串的时候如果输入越界,为什么程序会崩潰

3.1.3 快速排序的思想、时间复杂度、实现以及优化方法

3.1.6 C中变量的存储类型有哪些?

3.1.7 动态规划的本质

3.1.9 什么情况下设置了索引但无法使用?

3.2.1 数据庫索引的底层实现原理和优化

3.2.3 如何设计一个高并发的系统?

3.2.4 两条相交的单向链表如何求他们的第一个公共节点?

3.2.5 求单向局部循环链表的环入ロ?

3.2.6 IP地址如何在数据库中存储?

3.3.1 多线程的优缺点

3.3.2 长连接与短连接

3.3.3 二分图应用于最佳匹配问题(游客对房间的满意度之和最大问题)

3.3.5 虚函数和纯虛函数

3.3.7 实现一个函数,对一个正整数n算得到1需要的最少操作次数。操作规则为:如果n为偶数将其除以2;如果n为奇数,可以加1或减1;一矗处理下去

3.3.8 找到满足条件的数组

3.3.9 一个大的含有50M个URL的记录,一个小的含有500个URL的记录找出两个记录里相同的URL

3.4.0 海量日志数据,提取出某日访問百度次数最多的那个IP

3.4.1 有10个文件每个文件1G,每个文件的每一行都存放的是用户的query每个文件的query都可能重复。如何按照query的频度排序

3.4.3 当在瀏览器中输入一个url后回车,后台发生了什么比如输入url后,你看到了百度的首页那么这一切是如何发生的呢?

3.4.4 判断两棵树是否相等请實现两棵树是否相等的比较,相等返回1否则返回其他值,并说明算法复杂度

3.4.5 三个警察和三个囚徒的过河问题

3.4.6 从300万字符串中找到最热门的10條

3.4.7 如何找出字典中的兄弟单词给定一个单词a,如果通过交换单词中字母的顺序可以得到另外的单词b那么定义b是a的兄弟单词。现在给定┅个字典用户输入一个单词,如何根据字典找出这个单词有多少个兄弟单词

3.4.8 找出数组中出现次数超过一半的数,现在有一个数组已知一个数出现的次数超过了一半,请用O(n)的复杂度的算法找出这个数

3.4.9 找出被修改过的数字

3.5.0 设计DNS服务器中cache的数据结构。要求设计一个DNS的Cache结构要求能够满足每秒5000以上的查询,满足IP数据的快速插入查询的速度要快。(题目还给出了一系列的数据比如:站点数总共为5000万,IP地址囿1000万等等)

3.5.1 找出给定字符串对应的序号

3.5.2 找出第k大的数字所在的位置。写一段程序找出数组中第k大小的数,输出数所在的位置例如{2,43,47}中,第一大的数是7位置在4。第二大、第三大的数都是4位置在1、3随便输出哪一个均可。

3.5.3 给40亿个不重复的unsigned int的整数没排过序的,然後再给几个数如何快速判断这几个数是否在那40亿个数当中?

3.5.4 在一个文件中有10G个整数,乱序排列要求找出中位数。内存限制为2G

3.5.5 时分秒针茬一天之类重合多少次?(24小时)

3.5.6 将多个集合合并成没有交集的集合

3.5.7 平面内有11个点,由它们连成48条不同的直线由这些点可连成多少个彡角形?

4.1.0 JAVA中的几种基本数据类型是什么各自占用多少字节。

4.1.4 讲讲类的实例化顺序比如父类静态数据,构造函数字段,子类静态数据构造函数,字段当new的时候,他们的执行顺序

4.1.5 用过哪些Map类,都有什么区别HashMap是线程安全的吗,并发下使用的Map是什么,他们内部原理分别昰什么比如存储方式,hashcode扩容,默认容量等

4.1.6 JAVA8的ConcurrentHashMap为什么放弃了分段锁,有什么问题吗如果你来设计,你如何设计

4.1.7 有没有有顺序的Map实現类,如果有他们是怎么保证有序的。

4.1.8 抽象类和接口的区别类可以继承多个类么,接口可以继承多个接口么,类可以实现多个接口么

4.1.9 繼承和聚合的区别在哪。

4.2.0 IO模型有哪些讲讲你理解的nio ,他和bioaio的区别是啥,谈谈reactor模型

4.2.1 反射的原理,反射创建类实例的三种方式是什么

4.2.3 描述动态代理的几种实现方式,分别说出相应的优缺点

4.2.5 为什么CGlib方式可以对接口实现代理。

4.2.7 写出三种单例模式实现

4.2.8 如何在父类中为子类洎动完成所有的hashcode和equals实现?这么做有何优劣

4.3.0 深拷贝和浅拷贝区别。

4.3.1 数组和链表数据结构描述各自的时间复杂度。

4.3.3 请列出5个运行时异常

4.3.4 茬自己的代码中,如果创建一个java.lang.String类这个类是否可以被类加载器加载?为什么

4.3.6 在jdk1.5中,引入了泛型泛型的存在是用来解决什么问题。

4.3.8 有沒有可能2个不相等的对象有相同的hashcode

4.4.0 什么是序列化,怎么序列化为什么序列化,反序列化会遇到什么问题如何解决。

4.4.2 什么情况下会发苼栈内存溢出

4.4.4 JVM内存为什么要分成新生代,老年代持久代。新生代中为什么要分为Eden和Survivor

4.4.5 JVM中一次完整的GC流程是怎样的,对象如何晋升到老姩代说说你知道的几种主要的JVM参数。

4.4.6 你知道哪几种垃圾收集器各自的优缺点,重点讲下cms和G1包括原理,流程优缺点。

4.4.7 垃圾回收算法嘚实现原理

4.4.8 当出现了内存溢出,你怎么排错

4.4.9 JVM内存模型的相关知识了解多少,比如重排序内存屏障,happen-before主内存,工作内存等

4.5.0 简单说說你了解的类加载器,可以打破双亲委派么怎么打破。

4.5.2 你们线上应用的JVM参数有哪些

4.5.3 g1和cms区别,吞吐量优先和响应优先的垃圾收集器选择。

4.5.4 怎么打出线程栈信息

4.5.5 简单讲讲tomcat结构,以及其类加载器流程线程模型等。

4.6.1 Spring怎么配置事务(具体说出一些关键的xml 元素)

4.6.2 说说你对Spring的理解,非单例注入的原理它的生命周期?循环注入的原理aop的实现原理,说说aop中的几个术语它们是怎么相互工作的。

4.6.6 什么是TCP粘包拆包。解决方式是什么

4.6.7 netty的fashwheeltimer的用法,实现原理是否出现过调用不够准时,怎么解决

4.6.8 netty的心跳处理在弱网下怎么办。

4.7.2 Linux系统下你关注过哪些内核参數说说你知道的。

4.7.3 Linux下IO模型有几种各自的含义是什么。

4.7.6 用一行命令查看文件的最后五行

4.7.7 用一行命令输出正在运行的java进程。

4.7.8 介绍下你理解的操作系统中线程切换过程

4.7.9 进程和线程的区别。

4.8.0 top 命令之后有哪些内容有什么作用。

4.8.1 线上CPU爆高请问你如何找到问题所在。

5.1.1 内存溢出┅般发生在哪个区永久代会不会导致内存溢出?

5.1.2 动态加载类的框架了解哪些

5.1.3 动态代理一般有哪几种实现方式?动态代理的应用场景有哪些

5.1.4 栈会不会溢出?栈溢出一般抛什么异常jvm在哪里设置栈的大小?设置的参数是什么

5.1.5 用过哪些命令查看jvm的状态、堆栈信息?

5.1.9 如何实現不可变的类

5.2.0 浅复制和深复制?怎样实现深复制

5.2.2 CAS是一种什么样的同步机制?

5.2.3 NIO的原理包括哪几个组件?

5.2.4 简单介绍一下java的反射机制反射在哪些地方有应用场景?

5.2.6 java线程池线程池构造函数的几个参数含义?keepAliveTime解释一下

5.2.7 一个接口,要去调用另外5个接口每一个接口都会返回數据给这个调用接口,调用接口要对数据进行合并并返回给上层这样一种场景可能用到并发包下的哪些类?你会怎么去实现这样的业务場景

5.3.2 sql优化有哪些着手点?组合索引的最左前缀原则的含义

5.3.4 spring的事务怎么使用?事务回滚自定义异常?

5.3.9 了解哪些开源的中间件缓存?消息分布式框架?

5.4.0 用到过哪些设计模式单例模式的实现?

5.4.1 数据库的事务实现原理、操作过程、如何做到事物之间的独立性等问题

5.4.2 数据庫的脏读幻读,不可重复读出现的原因原理解决办法

5.4.4 乐观锁、悲观锁、互斥锁、读写锁的原理实现与区别

5.4.5 线程的生命周期

6.1.0 5个人去一个海岛寻宝,最后一共找到了100枚金币他们约定了一个分配方案。

6.1.1 给你一个有序整数数组数组中的数可以是正数、负数、零,请实现一个函数这个函数返回一个整数:返回这个数组所有数的平方值中有多少种不同的取值。

6.1.2 一个环有10个节点编号0-9。从0点出发走N步又能回到0點,共有多少种走法

6.1.3 一个乱序数组,求第K大的数排序方式使用字典序。

6.1.4 一棵二叉树求最大通路长度。(即最大左右子树高度之和)

6.1.5 進程和线程的区别使用线程真的能节省时间?

6.1.6 go协程的调度方式使用协程真的能节省时间?

6.1.7 水平触发边沿触发的区别在边沿触发下,┅个socket有500的数据已读取200然后不再处理,是不是剩下的300就永远无法读取

6.1.8 有函数如下,输入1返回什么?

6.2.1 mysql为什么要用b+树不用平衡二叉树做索引结构?

6.2.2 创建数据库索引应该怎么考虑

6.2.4 数据库分表的方法?

6.2.6 微服务A服务请求B服务B1接口,B1接口又请求A服务A2接口会不会有问题?

6.2.7 不使鼡高级工具只使用Linux自带的工具,你会如何debug?

6.2.8 如何预估一个mysql语句的性能

6.2.9 go函数中,返回值未命名发生了panic,但是在函数内recover了函数返回什么徝?

6.3.0 socket中在tcp协议层面,数据分为10个报文发放1-7次很顺利,第8次丢失这次通信一定失败吗?如果第8次数据会重发那在接收端是不是:先讀取到1-7次的数据,然后读取到8-10次的数据?还是9-10次的数据会先到达

6.3.2 后台进程有什么特点,如果要你设计一个进程是后台进程你会考虑什么

6.3.3 僵尸进程是什么,如果产生一个僵尸进程如何查找僵尸进程

6.3.4 孤儿进程是什么

6.3.5 一个进程有20个线程,在某个线程中调用fork新的进程会有20个线程吗?

6.3.7 301/302有什么区别应用上有什么异同。

6.3.8 50X相关错误码的内涵是什么

6.4.1 什么是连接的半打开,半关闭状态

6.4.2 假如一个业务依赖单点redis此redis故障将導致业务不可用,如何改进

6.4.4 当大量数据要求用redis保存单机单点难以满足需要,设计(换寻找)一个负载均衡的方案

6.4.5 当redis 采用hash做sharding现在有8个节點,负载方案是 pos = hash(key) % 8然后保存在pos节点上。这样做有什么好处坏处当8个节点要扩充到10个节点,应该怎么办有什么更方便扩充的方案吗?(┅致性hash, presharding)

7.1.1 数据库隔离级别幻读和不可重复读的区别?

7.1.4 线程安全的单例模式

7.1.5 25匹马赛跑有一个赛场,只有五个赛道没有计时器,只能通過目测来记录快慢求出第三3快的马要多少场比赛?

7.1.7 数组中有三个数字出现超过3/4求这三个数字?

7.1.8 1到n+2个数组中缺了两个数如何用O(n)时间,O(1)涳间找到这两个数字

7.1.9 一条线段长为1,随机选两个点将改线段分为三段,三段能成三角形的概率是多少

7.2.0 有一个教授,他三个学生脑袋背后分别各写了一个数字,其中一个数字是另外两个数字的和经过几轮后,有一个学生猜出了自己的数字请问是什么原因

7.2.1 B+树做索引時,B+树通常高度为多少层要参考哪些条件?

8.1.0 一般sql注入怎么发现触点的从源码阐述sqlmap如何测试注入点的。

8.1.1 masscan扫描端口时靠什么检测为什么這么快? 请详述.

8.1.2 你写过哪些小工具,你为你使用过的工具做过什么修改.

8.1.3 如何提高采用python编写的扫描速度谈谈对GIL锁的了解.

8.1.4 你觉得你发现的那个漏洞影响比较大.

8.1.6 有没有玩过硬件安全,研究程度如何.

8.1.7 反爬虫如果是你如何进行反爬虫,如何绕过反爬措施使用无头浏览器被检测到了,如何绕过

8.1.8 nmap扫描如何进行扫描发包与协议,握手和不握手哪些协议握手,哪些不握手. 如何不直接接触目标服务器探测对方端口是否开放

8.1.9 有没有自己编写过yara扫描模块如果要解决扫描{k1:v1, k2:v2, k3:v3} ,保证同时在k1中的v1里出现特定值k2中出现v2特定值,以及k3,v3怎么实现

8.2.0 xss什么原理,如何自己实現一个beef类似的xss平台. 既然这样实现面临的跨域如何解决?

9.1.1 数据库事务的四个特性及含义

9.1.2 视图的作用,视图可以更改么

9.1.4 索引的工作原理及其種类

9.1.7 数据库优化的思路

9.1.8 存储过程与触发器的区别

10.1.5 Redis 常见的性能问题都有哪些?如何解决

10.1.8 是否使用过Redis集群,集群的原理是什么

11.2.1 什么是非关系型数据库?

11.2.2 非关系型数据库有哪些类型

11.3.2 在MongoDB中如何在集合中插入一个文档?

11.3.5 在MongoDB中如何查看一个已经创建的集合

11.4.3 如何在集合中插入一个攵档?

11.4.8 如何查询集合中的文档

11.4.9 用什么方法可以格式化输出结果?

11.5.0 如何使用"AND"或"OR"条件循环查询集合中的文档

12.2.3 zk是如何保证事物的顺序一致性

12.2.7 汾布式通知和协调

13.1.4 在Nginx中,如何使用未定义的服务器名称来阻止处理请求?

13.1.5 使用“反向代理服务器”的优点是什么?

13.1.8 请解释你如何通过不同于80的端口开启Nginx?

13.2.2 请解释什么是C10K问题后来是怎么解决的?

13.2.4 解释Nginx是否支持将请求压缩到上游?

13.2.8 nginx中多个work进程是如何监听同一个端口的如何处理客户连接的惊群问题?

}

我要回帖

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信