有关往年百度笔试真题
有关往年百度笔试真题篇1
一,简答题(本题共30分)
1、当前计算机系统一般会采用层次结构来存储数据,请介绍下典型的计算机存储系统一般分为哪几个层次,为什么采用分层存储数据能有效提高程序的.执行效率?(10分)
2、Unix/Linux系统的僵尸进程是如何产生的?有什么危害?如何避免?(10)
3、简述Unix/Linux系统中使用socket库编写服务器程序的流程,请分别用对应的socket通信函数表示。
二,算法与程序设计题(本题共45分)
1,使用C/C++语言写一个函数,实现字符串的反转,要求不能用任何系统函数,且时间复杂度最小。函数原型是:char__reverse_str(char__str)(15分)
2,给定一个如下输入格式的字符串,(1,(2,3),(4,(5,6),7))括号内的元素可以是数字,也可以另一个括号,请实现一个算法消除嵌套的括号。比如把上面的表达式变成:(1,2,3,4,5,6,7),如果表达式有误请报错。(15分)
3,相似度计算用于衡量对象之间的相似程度,在数据挖据,自然语言处理中使一个基础性计算,在广告检索服务中往往也会判断网民检索Query和广告Adword的主题相似度。假设Query或者Adword的主题属性定义为一个长度为10000的浮点数据Pr[10000](称之为主题概率数组),其中Pr[i]表示Query或者Adword属于主题Id为i的概率,而Query和Adword的相似度简化定义为两者主题概率数组的内积,即sim(Query,Adword)=sum(QueryPr[i]__AdwordPr[i])(0<==i<10000)、在实际应用场景中,由于大多数主题的概率都为0,所以主题概率数组往往比较稀疏,在实现时会以一个紧凑型数组topic_info_t[]的方式保存,其中100<=数组大小<=1000,并按照topic_id递增排列,0<=topic_id<10000,0
现在给出Query的topic_info_t数组和N(N>=5000)个Adwords的topic_info—t数组,现要求出Query与Adwords的相似度最大值,即max(sim(Query,Adword[i])(0<=i&query_topic_info,Constvectoradwords_topic_info[],Intadwords_number);编写代码求时间复杂度最低的算法,并给出时间复杂度分析。(15分)
三,系统设计题(本题共25分)
在企业中,对生产数据进行分析具有很重要的意义。但是生产数据通常不能直接用于数据分析,通常需要进行抽取,转换和加载,也就是业界常识的ETL。
有关往年百度笔试真题篇2
一,简答题(本题共30分)
1、当前计算机系统一般会采用层次结构来存储数据,请介绍下典型的计算机存储系统一般分为哪几个层次,为什么采用分层存储数据能有效提高程序的执行效率?(10分)
2、Unix/Linux系统的僵尸进程是如何产生的?有什么危害?如何避免?(10)
3、简述Unix/Linux系统中使用socket库编写服务器程序的流程,请分别用对应的socket通信函数表示。
二,算法与程序设计题(本题共45分)
1,使用C/C++语言写一个函数,实现字符串的反转,要求不能用任何系统函数,且时间复杂度最小。函数原型是:char__reverse_str(char__str)(15分)
2,给定一个如下输入格式的字符串,(1,(2,3),(4,(5,6),7))括号内的元素可以是数字,也可以另一个括号,请实现一个算法消除嵌套的括号。比如把上面的表达式变成:(1,2,3,4,5,6,7),如果表达式有误请报错。(15分)
3,相似度计算用于衡量对象之间的相似程度,在数据挖据,自然语言处理中使一个基础性计算,在广告检索服务中往往也会判断网民检索Query和广告Adword的主题相似度。假设Query或者Adword的主题属性定义为一个长度为10000的浮点数据Pr[10000](称之为主题概率数组),其中Pr[i]表示Query或者Adword属于主题Id为i的概率,而Query和Adword的相似度简化定义为两者主题概率数组的内积,即sim(Query,Adword)=sum(QueryPr[i]__AdwordPr[i])(0<==i<10000)、在实际应用场景中,由于大多数主题的概率都为0,所以主题概率数组往往比较稀疏,在实现时会以一个紧凑型数组topic_info_t[]的方式保存,其中100<=数组大小<=1000,并按照topic_id递增排列,0<=topic_id<10000,0
现在给出Query的topic_info_t数组和N(N>=5000)个Adwords的topic_info—t数组,现要求出Query与Adwords的相似度最大值,即max(sim(Query,Adword[i])(0<=i&query_topic_info,Constvectoradwords_topic_info[],Intadwords_number);
编写代码求时间复杂度最低的算法,并给出时间复杂度分析。(15分)
三,系统设计题(本题共25分)
在企业中,对生产数据进行分析具有很重要的意义。但是生产数据通常不能直接用于数据分析,通常需要进行抽取,转换和加载,也就是业界常识的ETL
有关往年百度笔试真题篇3
1、1—20的两个数把和告诉A,积告诉B,A说不知道是多少,B也说不知道,这时A说我知道了,B接着说我也知道了,问这两个数是多少?
答案:2和3
2、爸爸,妈妈,妹妹,小强,至少两个人同一生肖的概率是多少?
1—12__11__10__9/12__12__12__12=1—55/96=41/96
3、计算a^b<<2
答案:
运算符优先级:括号,下标,—>和、(成员)最高;
单目的比双目的高;
算术双目的比其他双目的高;
位运算高于关系运算;
关系运算高于按位运算(与,或,异或);
按位运算高于逻辑运算;
三目的只有一个条件运算,低于逻辑运算;
赋值运算仅比,(顺序运算)高。
在此题中,位左移”<<”优先级高于按位异或”^”,所以b先左移两位(相当于乘以4),
再与a异或。
例如:当a=6;b=4时;则a^b<<2=22
4、如何输出源文件的标题和目前执行行的行数?
答案:printf(”Thefilename:%d”,__FILE__);
printf(”ThecurrentlineNo:%d”,__LINE__);
ANSIC标准预定义宏:
__LINE__
__FILE__
__DATE__
__TIME__
__STDC__当要求程序严格遵循ANSIC标准时该标识符被赋值为1
__cplusplus__当编写C++程序时该标识符被定义
5a[3][4]哪个不能表示a[1][1]:__(&a[0][0]+5)__(__(a+1)+1)__(&a[1]+1)__(&a[0][0]+4)
答案:__(&a[1]+1)
a是数组的首地址,a[1]就表示a[1][0]地址了,不用再取地址了。
6fun((exp1,exp2),(exp3,exp4,exp5))有几个实参?
答案:两个。
形式参数:在声明和定义函数时,写在函数名后的括号中的参数。
实参是调用参数中的变量,行参是被调用函数中的变量。
7、希尔冒泡快速插入哪个平均速度最快?
答案:快速排序
快速排序、归并排序和基数排序在不同情况下都是最快最有用的。
8、enum的声明方式。
答案:enum枚举类型名{枚举常量1,枚举常量2,…枚举常量n};
Forexample:
enumweekday{sunday,monday,tuesday,wednesday,thursday,friday,saturday};
enumweekdayweek_day;//week_day就是一个枚举类型变量
9、频繁的插入删除操作使用什么结构比较合适,链表还是数组?
答案:链表
10、__p=NULL__p=newchar[100]sizeof(p)各为多少?
答案:都为4。因为都是指针类型,所占存储空间必然为4。
11、顺序查找的平均时间
答案:(1+2+3+…+n)/n=(n+1)/2
12、for(i=0,sum=0;i<10;++i,sum+=i);的运行结果。
答案:sum=55
13、不能做switch()的参数类型是:
答案:switch的参数不能为浮点型。
14、不使用其他变量,交换两个整型a,b的值。
答案:x=x+y;y=x—y;x=x—y
15、写出floatx与“零值”比较的if语句。
if(x>=0、000001&&x<=—0、000001)(x不为0的比较)
float:6位精度
double:16位精度
16、有个表tableQQ,有整型的ID项和字符类型的Nickname项,这两个项都不允许为空。
(1)写出建立该表的SQL语句
(2)找出Nickname为QQ的用户,按ID降序排列的SQL语句
(3)写出删除ID为1234用户记录的SQL语句
(4)写出添加ID为5555,Nickname为’1234′的SQL语句
答案:
(1)CREATETABLEtableQQ
(IDNUMBER(12)NOTNULL,NicknameVarchar2(30)NOTNULL);
(2)select__fromtableQQwhereNickname=‘QQ’orderbyIDdesc;
(3)fromtableQQwhere>
(4)intotableQQvalues(5555,’1234′);