Sheetaの摸鱼日记(五)
你在质疑什么,我们的前途就是风光。
11周的暑假,军训两周小学期四周就占了一半。
想了想决定剩下的时间里什么都不干(
非要干点什么的话就去把车学完把科三科四考了,然后可以学学托福,可以尝试下自己感兴趣的事情或者继续发展自己的爱好,比如画画钢琴自媒体etc.
之前的我过于心急了点,结果能力不够,可以说什么都没做成,还疯狂地内耗
希望这个暑假能好好调整,实在不行的话也没关系,还有一年的时间可以用来调整状态
2023/6/27
军训第二天,尽管下午冒着39℃的高温去合唱排练,但是取消了晚训,真是个好消息
希望剩下的训练也可以这么轻松
发现还是要早点睡觉,不能熬夜,虽然刚熬过期末周的大学生真的很不适合军训,比如我昨天晚上训练差点晕倒了三次,真的眼前开始发黑直到看不清任何东西🥀
每逢军训必会晕倒一次😂
然后今天早上特意带了一盒宝矿力的冲剂,中间休息时间喝水时就倒了点在杯子里,感觉比昨天晚上的感觉好得多
虽然现在我已经体会不到这个年级军训有什么意义,但是也没有办法,只能这样继续过
.
2023/6/28
军训第三天,早上训了一个小时突然开始下雨,于是我们就转移到体育馆里进行唱歌训练,还有各连才艺展示
印象最深刻的是一男一女跳舞,伴奏是《如果这就是爱情》,跳的应该是拉丁?还是伦巴?不太了解
跳的真的好好!虽然都穿着军训服装,没有精心打扮过,但是能感受到他们跳的美与热情
有点羡慕
晚上练习正步,练的我脚腕疼,估计与鞋也有点关系。回来贴了一片姜贴,希望明天能好一点
明天应该很轻松,上午就去建馆听听讲座“战伤自救互救科目”,不知道晚上有没有安排,希望没有(保佑)
军训真的好累😥这强度远没有大一的高都这么累,果然身体素质不如以前了
空闲时间什么都不想干,只想刷刷手机看看小说,还有睡觉
到点了,该睡觉了
感觉军训最大的作用就是强制把我的作息时间往前移了点
.
2023/6/29
今天查了查成绩,十分破防😥
这学期的课开出了好几个2.x😭
4学分的大物只有C,我期末是考的有多差啊,真的学不会物理www
然后3学分的材料力学居然只有C-,明明期中和平时作业还有实验都做的不错的,难道期末只考了五十几分吗?有点不敢相信,在想要不要去申请复议😞
3学分的电电C+,没想到我最担心是否挂科的电电居然在这一众成绩中排名还很高
OOP也只有B,唉,上学期的程设也只有3.6,有点茫然,感觉平时学的也不错为什么考不出我想要的效果
尤其是今年OOP的题目过于阴间了,按照往年题的难度不说满分400,得个300~350还是可以的,结果考试延时了十五分钟还是没把第三题的bug改好,最后只有200分😞唯一值得慰藉的是旅游期间写的大作业得了9分(满分10分)
物理不好的人真的好惨😞这学期的成绩真的好打击人,本来还想把绩点往上拉一拉的,结果成绩一出估计直接掉下3.7了,sigh
躺在床上,焦虑未来有没有书读,没有的话直接找个公司上班算了
.
2023/6/30
上午定向越野,在打卡一个西操南边小山坡上的点位时突然发现水木清华的荷花开了
在重重树枝间突然见到了一个小口,从小口处可以看到水木清华,以及粉嫩的荷花
难以形容当时的感受,就突然间意识到现在已经是盛夏了
.
2023/7/2
拉练,走完感觉腿都不是自己的了
然后躺床上睡到了十二点多,而且躺着的时候腿特别疼,翻来覆去怎样调整姿势都疼
下午集体观影,突然想起高中的集体观影还是大家聚集在操场上,前面放个大屏幕播放电影。夏季的晚上很热,蚊虫也多。上了大学后这种军训集体观影都可以移到凉快的室内进行了,有点感叹。
其实我觉得电影还行,但不知道为什么那么多人都在吐槽😥感觉也不至于到了完全看不下去的地步吧,不太能理解
晚上太困了,九点多就上床了😴
.
2023/7/3
今天早上训练的时候胃特别疼,估计是昨天下午吃了一个圣代的缘故😤
九点到十点学习军体拳,“杀杀杀“😂
回来后有人在群里发了一组emoji,笑死了,十分的形象:
说实话,感觉军训的日子还挺好,每天除了训练就是睡觉、玩手机,暂时不用为未来焦虑
————————————
今晚拔河,才拔了 两秒,绳子突然断了😲
.
2023/7/6
军训期间的生活belike:
起床吃早餐——训练——画画——吃午餐——画画——睡觉——起床吃晚餐——训练——画画——睡觉
感觉画画会让我有一种久违的充实感,或许我真的应该去学艺术而不是工科(
不过当兴趣变成工作了估计也就那样了😞
今天上午在东大操场晒麻了,只能说清华是懂自愿的
.
2023/7/7
今天当着连长的面磕他和三排长的cp😂
欢送会有点美好地不像真的
…
2023/7/20
快两周没有更新了,似乎军训结束又是一个节点
回家后有点无聊,因为好朋友们都还没有回来,每天上午跟别人搞两个小时的补习,下午四点去学车三个小时(其实真正上手开的时间不到一个小时),剩下的时间都在睡觉、玩手机……混吃等死
基本处于一个什么都不想干的状态🥀
估计还可以在家呆二十天,希望能干点活,哪怕只干成一件事😂
感觉放假了就不想写日记,因为每天的生活都差不多,也没有什么值得纪念的人和事
以前写日记纯粹是记录,现在写似乎带了点自我剖析,不变的是浓厚的主观色彩
不过现在都不敢看高中写的日记了,不想再陷入回忆中了😔人应该往前看
——————————————
记录一下几天前发生的一件事:
学车时带了有清华logo的帆布袋,这个暑假第一次上车时把袋子放后座上,我在驾驶位复习灯光时,余光瞟到了后面的男生激动地用手机把我的袋子拍下来😂
然后前几天在路旁等教练,准备上车的时候突然有个男生问我你是不是仙桃中学的,我说是啊,他又问“你是不是lyd”。我当时还有点惊讶地回答说“是啊,你认识我吗?”然后他说和我是一届的
接着我们就开始练车了,也没有交流
然后第二天去学车,在路旁等的时候他来找我聊天,用一种很崇拜的语气😂问我高考各科成绩,问我学什么专业。他听说我高考语文才117(因为以为会过120)时还有点不好意思地说他语文才89
突然感觉有点可爱是怎么回事hhhh
不过说实话,我好久没有回答过这类问题了,好久没有直接面对别人的崇拜羡慕了😂
可能高考真的离我已经很远了
.
2023/7/22
今天科三特训,从上午八点多一直搞到下午两点半
跑了八趟,人都麻了
其中有直线行驶跑歪了两次😭不过可能最后一次的时候已经很累了不想跑了,虽然这也不能作为接借口
希望后天科三能过,毕竟练了这么多天了
千万千万不要挂我啊(保佑)
————————————
感觉一放假就什么都不想干,连电脑都不想打开,每天除了玩手机就是睡觉
虽然很喜欢这样,因为不用动脑子😂但总觉得少了点什么
等把科三考完再看看能不能改变一下吧
.
2023/8/19
好久没写博客了,感觉每次放假只想躺着,不想学习、不想思考、也不想输出。
这个假期还挺充实的,虽然只有40天左右:
- 考了科三科四,拿到了驾照。不过拿到驾照后还一次都没开过车
- 给一个初升高的妹妹补英语,每天上午9:30-11:30,不过经常会超时,补了20天,拿了6k(十八线小县城是这样的
- 和爸妈去神农架玩了三天,大概有一半的时间都在车上吧,走山路,下来玩的时间倒不多。很凉快,景色也还挺好看的
- 时隔7年再次去了香港和澳门,感觉印象更深刻了一点。同时顺便逛了逛珠海和广州,感觉珠海适合养老!吃到了广州的双皮奶!之前吃到的双皮奶都是牛奶布丁,虽然还挺好吃的。美中不足的是这几个地方都很热啊
————————————————
今天下楼拿外卖时看到了三字班的学妹们,基本都是一大家子陪着,拿行李,收拾宿舍……
想当初我那年疫情期间,好像只能报道当天进校,而且家长根本进不去呜呜呜,我都上了两年大学了爸妈都还没有来过清华一趟……
疫情造成的遗憾,谁能补的了呢?
决定小学期期间也用这个算了,等开学再开一个新的。
.
2023/8/21
今天终于把那道题写完交了上去,感觉应该是要寄(心碎
觉得自己的能力还不太够,sigh
但是不管怎么说,努力过了,结果怎样其实没那么重要了(虽然还是很想要一个好结果
.
2023/8/22
看小说看到了一个很棒的科研点子,于是搜了一圈,发现早在20年就已经有人研究这个了
虽然我觉得做出来的结果不怎么样
.
2023/8/23
小学期第一天,也是三字班报到的一天。
似乎只有在新生的身上才能看到对未来的憧憬,反正至少我只感觉到些许麻木
感觉今天下午上课状态还不错,可能因为是第一天,还没有上强度,希望后续还能够跟上
和好朋友打了打电话,安慰了一下“失恋”的朋友
果然,感情这东西太复杂了,并且当局者迷(摇头
今天练了一篇听力,感觉总是第一遍听要写题的时候什么都听不出来,但是第二遍听又能大致听出来了
听力怎么这么难呜呜呜,上次考的听力分数居然比口语还低,十分破防
暂时规划一下小学期:
1.课上认真听讲(不要再玩手机了!),努力跟上老师,课后复习梳理一下知识点
2.大小作业认真完成
3.每天至少练习一篇听力
4.尝试刷一下绿宝书
5.看crash course感兴趣的内容(可做可不做
6.继续阅读
虽然好久都没有做计划了,也好久都没有完成所做的计划了,但还是列一下吧
希望我的小学期是充实而快乐的
.
2023/8/24
下雨了,昨天晚上就开始下了,今天下的更大更急,大概是要降温了吧,北京的秋天总是来的格外快
想到了高中学的那篇课文《故都的秋》,其实我只记得那句话,课文名还是百度出来的
“可不是么?一层秋雨一层凉了!”
想了想,学这篇课文大概已经是4年前了?以前学的时候只是抱着应付的心理,为了高考,为了应试
没能用心体会许多课文的美
如今也只能偶尔在某个时刻感叹其中描写的传神,感叹物是人非,感叹当时只道是寻常
————————————
宁愿听托福听力也不想背单词😥但是不背单词的话听力阅读都会很烂,感觉需要有一个人push我🥀
感觉小学期强度有亿点大,虽然每天不到三个小时,但是在这不到三个小时中既要跟上老师的讲课节奏,又要随时准备做oj题,我真的好难💔
北京的气候好干燥,这几天脸上唇上一直在起皮💔还是喜欢我温暖干燥的南方。
最近两天晚上都在文图自习,有点喜欢文图的氛围了,与北馆相比更加独立(不是好几个人共用一张大桌子),而且它略有点昏暗的光线好适合我这种生活在黑暗的人(x)。可能文图唯一的问题就是开学后不好占座。现在比较进图书馆后找个喜欢的座位坐下后再在手机上预约这个位置,这样不用耗费时间找自己提前预约的位置,而且还可以知道这个位置周围的情况,比如像我就更喜欢坐在旁边没有人的位置或者旁边是女生的位置
希望能活过小学期(短期目标),长期目标是活着毕业🤕
.
2023/8/25
mark一下:
2023.8.18开始好好养头发
2023.8.23开始打卡托福听力
2023.8.25开始好好养皮肤
什么时候才能下定决心把作息时间调整一下
——————————
今天做的这篇托福听力好难TT,基本处于啥都没听懂的状态,sigh
准备等把这十几套题都听完后就开始第一遍听的时候尝试做一下笔记
——————————
今天上课时和旁边的女生交谈了几句,然后下午吃完饭离开食堂时收到了之前被拉进计2女生群时被加过的一个女生的微信消息,然后发现原来我已经加过她了!有一种网友奔现的感觉哈哈哈哈。当时课上还想着要不要跟别人加个微信,然后觉得下星期也会见到,或者下学期上课时也可能见到(毕竟女生真的很少啊!就那么几个),就没有问出口。感觉真的是太巧了。
今天助教讲了第一个大作业的内容与要求,10天完成一个大作业……而且感觉助教和老师几乎什么都没有讲啊,主打一个自学,有点无奈,而且与平时上课讲的内容也没什么太大的联系
还不如面向大作业学习呢
简单地计划一下,周末把数据爬出来,并且处理好;下周一周二开始写网页。
今晚刚完成托福听力的打卡,剩下的时间是周末时间嘻嘻
.
2023/8/26
今天没有听托福听力,有点小惭愧
花了一天的时间研究爬虫,似乎去年这个时候我也在研究学习爬虫,真的有点点难啊呜呜呜
今天抢到了四张票,一张华晨宇的看台,一张学校的电影票,还有两张林俊杰的看台票(其中一张是帮dyj抢到了),开心
明天和洋子约好了晚上一起吃饭,然后夜骑长安街!感觉有点刺激
就是这样的话我可能需要明天早点起床肝大作业了,希望我起得来
.
2023/8/27
室友们都回来了,宿舍独享卡结束了
今早一醒来就发现洋子把我鸽了😥感觉在北京找个一起吃饭的人好难
今天早上做了个梦,梦里刚好出成绩,然后我发现我的电电挂科了……
过于惊悚,幸好醒来发现是个梦
——————————————
好爱文图二层A区的扩展屏,写代码的时候放一些资料在扩展屏上十分方便
可惜早上去的晚就没有了呜呜呜
今天早上纠结了半天还是去的北馆,因为有点想吃观畴的焖面,然后吃饭的过程中被借了两次卡😢
——————————————
研究大作业里的网页设计,有点绷不住了。这是想我两天学会html+django再用两天把网站写出来吗?还要那么多的功能需求需要满足呜呜呜,这都比得上别人的毕业设计了吧🙃
这就是清华计算机系吗?已经有点相看两厌了😂
噢对,记录一下周末写大作业的进度:
爬虫部分的代码已经写好了,但是还没有开始爬数据
网页的Django框架搭建起来了,正在自学怎样使用Django
.
2023/8/28
中午wyh问我爬虫的代码写没写,说她爬了0就停下来了。然后我立马运行了一下写完的程序,发现有bug,于是一直在debug,从12:23到现在14:41,终于改完了呜呜呜。
艹,发现评论的数量还没有debug改出来……
改到了15:19,发现大作业文档里关于“热度”的处理更新了,遂放弃爬取评论的数目
——————————————
今日大作业进度:
- 爬虫部分的代码debug成功,5000+新闻数据已经爬好储存在.txt文件中
- 依照各种资源学习了一下Django,资源包括官方文档和各种项目的搭建案例。大致框架已经写的差不多了,接下来就是完善框架+实现要求的功能
感觉北馆和文图的椅子坐久了屁股好难受,然后实在受不了了就会因为太想念宿舍的椅子而回宿舍。看来还是要多起来走动一下。
今天早上被尿意唤醒后就一直没有睡着,然后又被外面宿舍楼下传来的军训口号声进一步驱散了睡意,所以干脆起来去吃早餐,感觉好久没有在八点多这个点吃过早餐了。晚上回宿舍时发现紫操上正在拉歌,唱的还是那首经典的《团结就是力量》😂
明天重新和洋子约好了晚上一起吃饭+夜骑长安街😋希望能顺利实施
.
2023/8/29
日常为托福和小学期大作业破防……
感觉每次练托福听力,练第一遍还没有进入状态,导致一般听的会很懵,基本经常什么都没有听到。一段材料至少听三遍以上才能听懂sadsad
托福怎么这么难啊,为什么别人一考就是100+呜呜呜
——————————————
昨晚零点,在被窝里单曲循环许嵩的新歌《如谜》。
记得应该是从初二开始吧,16年还是17年,许嵩一发新歌,那个中午我必然会在饭桌上单曲循环。我还记得初二期末考试的一天中午,听了一中午的《通关》哈哈哈哈。
然后高三的三四月份(《呼吸之野》发行的时候),都舍不得在考试前听新歌,怕在脑中单曲循环从而干扰考试,于是就将新歌攒着听。
就这样听歌听了好多年。
——————————————
晚上和洋子一起去吃了念了好久的比格披萨自助,撑死了
然后去夜骑长安街,结果找共享单车找了四十分钟(骑行了一个来回也才五十分钟😂
回来后累死了,也不想再写大作业了,所以直接睡觉了
长安街上骑行的人很多,在骑行的过程中我能体会到京城的底蕴与活力,有点想哭
.
2023/8/30
8.29~8.30大作业进展:
- 仔细学习了一遍Django的文档,结合各种资料大致写完了templates里的html模板内容,完善了一下views.py里的函数
接下来需要把爬到的数据导入数据库里面
但是我今天不想写☹
烦,有一种ddl悬在头上却想摆烂的感觉
——————————
看小说看到了一句话:
是身如焰,从渴爱生。
百度了一下,这句话出自《维摩诘经》。
为信念和爱燃烧自己的能量,这爱在,便永远热烈,永远光亮。
.
2023/8/31
今日大作业进展:
- 编写python脚本,将爬出来的数据成功导入了sqlite3数据库
- 首页随机新闻展示模块调试完毕;新闻列表页调试完毕;新闻正文页基本信息展示调试完毕(具体内容先不看,比如正文的格式,文章的分类,评论功能等)
今日好幸福。
上午买了一杯瑞幸的橙C美式,被惊艳到了。没有拿铁那么腻(每次腻到我都开始犯困了),口感很清爽,有橙汁的清香,咖啡的味道也没有那么浓,总之一切都刚刚好。
晚上去大礼堂看了《封神第一部》,好好看!就是感觉太短了,故事就开始了一个头电影就完了呜呜呜,希望第二部第三部快点出来(不然我就忘了)。还有就是,里面的小哥哥的身材都好好😍基本上腹肌和胸肌都有,给这部电影增添了大大的亮色。
.
2023/9/1
今日大作业进展:
- 分类页和分类详情页调试完毕(除了分类页展示每一类下的新闻数量还没有搞)
- 新闻正文页评论功能调试完毕
.
2023/9/2
今日大作业进展:
分类页展示每一类下的新闻数量搞定
将图片爬到了本地下载保存,网页图片加载搞定
将pub_date数据清洗了一下并更新到了数据库,将hotness添加到数据库(学会了怎样逐行修改数据库某一列的值呜呜呜)
显示每篇新闻的评论数量搞定
搜索功能写好了,但是无论怎样都搜不到新闻,sad
- 单选框调试完毕
- 多选框调试完毕
- 搜索功能调试完毕
未完成的:
- 界面美化(什么CSS都没有用,界面丑的要死😂)
- 搜索算法优化
- 给首页增加跳转到新闻列表页、分类页的按钮
——————————————
翻了翻FAQ文档,突然发现需要手写算法来实现搜索功能🙃有点崩溃
——————————————
这个写代码时间过于离谱了,清华贵系小学期,你害人不浅😥
.
2023/9/3
今日大作业进展:
- 终于学会了用bootstrap并实现了界面一定程度的美化(尽力了
- 给每一页都增加了跳到首页、新闻列表页和新闻分类页的按钮
- 尝试优化搜索性能,结果什么都没干(x,我觉得我写的已经很好了,希望没有太大问题吧
- 思考了一下数据可视化分析能从哪些方向进行,用matplotlib画出了一张图
明晚爬虫和网页部分现场验收,祝我好运
.
2023/9/4
今晚去fit楼验收大作业,感觉胥导真的好好www,按照大作业的要求全部验证了一遍,然后搜索的实现方式提了一嘴(也有可能是我没有写算法,所以没有问具体的实现方式),搜索了好几个,结果出来时还夸我说很好😭
骑车回宿舍整个人都轻松了不少,感觉前些天天天泡图书馆肝大作业还是值得的。
.
2023/9/5
写完了所有的报告,整理了一下源代码,交上了大作业,终于可以短暂地喘口气了
感觉每次写代码一旦进入状态,总是很投入、很专注,而这种专注力我上大学之后就好久没有过了
遇到问题不会破防,而是积极地搜索,积极地想办法解决它
感觉不仅情绪更稳定了,能力也更强了,还找回了遗失很久的专注能力(虽然有时候也会因为摆烂而不想写代码)
以前所做的这一切都是值得的
.
2023/9/6
昨晚去看了奥本海默,说实话,三小时的电影看的我有点坐不住了,尤其是最后一小时
没有身边人说的那么好看,可能是我的期望值太高了,但是我觉得还没有《封神》好看,大段大段的非母语对话让人看的有点疲惫。不过我发现有的倒装句我能听出来它的意思(在看翻译前😂,虽然是很简单的句子,不过应该也能说明我的听力水平高了一点点吧。
刚开始看的时候让我想起了高三看的《上帝掷骰子吗》,说真的,它是我心中讲科学史的top1(不过我貌似也没有看过别的讲科学史的书),还记得上学的下课时间给lsy讲里面的内容,成功让她种草😎
这书看完真的让我有一种想去搞理论物理的感受
想了想看过的这书,对奥本海默这人没什么印象,倒是对海森堡有印象,而且纳粹造原子弹落后的原因不是因为铀的含量计算错误吗?怎么扯到减速剂重水和石墨了?不过我觉得没印象的原因可能是这书主要是讲整个量子力学的发展史,而最后造原子弹其实是很小的一部分。
本来之前看别人对这个影片夸的天花乱坠还准备去买影博一百多的票,现在看来幸好没有买😂
————————————
今天早上做梦,梦到自己在破案,结果刚有一点点线索就因为室友起床而醒了😐
————————————
今天有点开心😊和小学期认识的朋友一起去玉树吃饭、聊天
.
2023/9/7
今早看了余秋雨先生写的《文化苦旅》的《藏书忧》一篇,颇有感触。
想起了小学的时候,无论是去青青家园超市还是商城大厦,总是喜欢去卖书的那一块小小的地方,拿一本书,坐在那阅读。那时候这种卖书的地方总是有不少人,还没有被超市逐出去。所以每次出去逛,基本上都是爸妈或者妈妈和小姨去逛,我在那看几个小时的书,丝毫不觉得无聊,只是觉得低头久了脖子会酸。
小学的时候不喜欢刷题,甚至连学习和作业都是完成老师布置的就好,除了玩乐就是喜欢阅读。当时手机还不太流行,大家不像今日的小学生一样带手机来学校,而是带书。一本书经常会有好几个人传阅,甚至有时候需要提前排队才能阅读一二,实在等不及了就和好朋友挤在一起看那本书。小学还有那种每月订的杂志,我总是会订很多,那估计是我最开始的阅读和科学启蒙。
小学的时候经常去同院子里的朋友家,很长一段时间就是去她家看书,三个人,各拿一本书看,没看完的还会借回家去。
上初中后学业重了不少,阅读时间也少了,但是在寒暑假,我总会和好友一起走去学校对面的超市里,那里有一片卖书和阅读的地方,不过开封的书大都是名著。我一本本的看,一个寒假几乎把那些开封过的名著看完。
初中的某日同学借我看了一本《哈利波特》,于是回去央求我妈帮我买了一套,可以说这套书帮了我大忙。有时候晚上回去心情不好的时候,我就不会写作业,只是看书,看到睡觉的时间。看着看着,心情就好起来了,带着满足感睡觉,所以初中从不会因小事而黯然神伤。这套书我花了好几个学期才看完,每一本都是见缝插针地看,晚上写完作业后、放假时、大考后……书看完了,初中也就快要结束了。
还记得初中的一件事,初二的某个学期,地理老师像是突然变了一个人,他在课上对我们说要读多书(大致是这样,具体的话记不太清了),然后就看向我说:lyd的家里就有好几书柜的书……后来的某日,放学时我在校内骑自行车不小心和别人撞了,自行车的车把歪了,何老师彷佛从天而降一样,跑过来把我的自行车车把掰正了,问我有没有事。再后来,我就没有再见到过何老师了。
初三时老师强制要求周末的放假时间来学校自习,我往往会在周日的上午来的很早,但是不会进教室学习,而是拿一本书放在走廊的边沿上,站在走廊上看。至今还记得当时看的那本书是《巴黎圣母院》。
上高中后,阅读时间更少了,不过看每一本书的场景都还在我的记忆里面。
提招没分班前某次语文老师在上面讲语文试卷,我在下面看《三体》,记得两节课把三体第二册看了70多面。高一时还会去学校那个简陋的图书馆借书,但是因为看的时间少,所以看的也慢,怕老板催,后来就没再去过了。那个时候看了至今都是我心中的top1《飘》。高二碰上疫情,先开始也是浑浑噩噩地刷手机,后来觉得应该利用这时间读点书,于是把每天吃完饭后刷手机的时间减少了,基本上看看有没有新消息就作罢,剩下的时间都用来看书,这时候看的就是电子书了。高三意外的多了一点时间看书,不过看的大都是杂志,《看天下》《环球人物》等等。整本的书基本是放假看的,还记得放寒假的那个晚上看《你当像鸟飞往你的山》看到了凌晨两点。高考期间为了减少外部干扰,没碰手机,却在第一天考完后下楼去文具店买了一本《环球人物》,不想复习的时候就看看。
高中的时候总喜欢隔一段时间买一些书,但是很少能看完,一部分是因为没有时间,另一部分是买的书质量参差不齐,看了几眼就没兴趣了。
高考完后看的书基本都是电子书了,尽管很方便,却总觉得与纸质书相比少了些什么。
上大学后感觉也没怎么阅读了,注意力被各种杂事占据,连学习的时候都不如以前专注了,更别提好好地阅读一本书籍了。忙的时候连休息都没空,不忙的时候总想刷刷手机,阅读总是排在最后。有时候想想以前看书的时候,不由得唏嘘不已。
——————————————
今晚点了喜茶中我至今最喜欢喝的那款,然后窝在宿舍里继续看《文化苦旅》,又看了一个小时,终于把它看完了。
很久没看过这种十分文学化的散文题材的书了,中途一度看的有点艰难,但静下心来读反而能品味出其中的滋味。还没有挑好下一本看什么,我觉得今天疯狂看书的原因可能是马上就要写第二个大作业了,估计到时候又会一天到晚地肝代码,就没有什么时间看书了。
——————————————
算了,不要焦虑了,目前最紧的是把托福考出来,争取最晚在明年寒假考出来吧
.
2023/9/8
今早八点就起了,而且是感觉自己睡好了才起的
看来晚上还是要早点睡,昨晚头疼的不行,不到十二点就上床了,大概十二点半就睡了(平时都会在床上玩手机到一点甚至一点多的
感觉目前很担心科研,因为科研几乎为零,之前报的两个srt,一个虽然学了很多东西,但是没有真正研究什么,只是学了一下会用到的工具;另一个开了两次会就没有什么活了🙃在清华学了两年,科研经历还是零,sad。真的不知道怎么找到一个能仔细带我的老师/学长学姐,再加上有点社恐,就更难了😞
托福没考出来,口语也不行,好难办
——————————————
记录一下用公钥登录远程服务器的配置方式:
①在服务器上创建.ssh文件夹:mkdir .ssh
;保证文件夹安全:chmod 700 .ssh
②在本地的cmd中输入powershell,将本地的公钥复制到远程服务器:
1 | scp C:/Users/ultrarealistic/.ssh/id_rsa.pub username@hostname:/home/username/.ssh/authorized_keys |
③配置ssh config
——————————————
晚上雨下的好急,空气的湿度让我找回了一点南方的感觉,看朋友圈里好多人发路上被淹了的情景,看来清华的排水系统也不怎么好啊
希望自行车淋一夜的雨后没事
.
2023/9/9
.
2023/9/11
回火星的这两天彷佛做梦一样,梦醒了,就要面对现实了。
感觉这次演唱会后遗症好严重😢为什么人不能一直在火星呜呜呜
决定等把大作业交上后选一些小华的美图去印小卡,留着自己看嘿嘿嘿
今天逛圆明园的时候被火姐塞小礼物了,开心死我了
————————————
今日大作业进展:
prepare_sft.py终于改的能跑了,也生成了微调数据,微调训练也跑了起来。但是不知道为何train loss下降的很快,而且很小,但是val loss基本一直在上升,可能是因为模型有点过拟合,问题需要解决🚬
.
2023/9/12
听录的音频,发现把手机举起来拍照时录的声音更加清晰(虽然还是比不上现场),下次吸取经验教训😥
————————————
时常会有我喜欢的歌别人不配听的感觉(),所以很少会和别人分享歌曲。我始终觉得音乐是个非常个人的事情,如果我给你分享歌曲,那一定是因为我很喜欢你(‾◡◝)如果你恰好和我喜欢同一首曲子的话,我会感到很高兴,甚至某些情况下会感到一些灵魂的共振。
————————————
大作业:
- processed_pretrain: 预处理数据
- processed_sft3: 微调数据(用‘@’’#’’%’区分的,且数据更多)已删
- processed_sft4: 微调数据(用‘@’’#’’%’区分的数据更多,且储存的是一个个长度为256的数组)已删
- out-1694441946: 第一次微调后的模型(但是模型没有保存,且train loss下降但是val loss上升)已删
- out-1694496028: 预训练后的模型(dropout=0.0)已删
- step 5000: train loss 0.5296, val loss 0.5314
- out-1694497362: 预训练后的模型(dropout=0.2)已删
- step 5000: train loss 0.6265, val loss 0.6198
- out-1694498407: 微调out-1694496028后的模型(dataset=processed_sft2, dropout=0.2)已删
- step 5000: train loss 0.0330, val loss 1.2546
- train loss下降但是val loss上升T_T
- out-1694505641: 微调out-1694496028后的模型(dataset=processed_sft3, dropout=0.4)已删
- 这个效果比上一个差,可能是dropout高了点?
- step 5000: train loss 0.0377, val loss 1.4655
- out-1694512850: 微调out-1694496028后的模型(dataset=processed_sft4, dropout=0.2)已删
- val loss先下降然后一直上升TT
- out-1694534437: 预训练后的模型(dropout=0.0,dataset=processed_pretrain2)已删
- step 5000: train loss 1.2267, val loss 1.2286
- out-1694536341: 预训练后的模型(dropout=0.0,dataset=processed_pretrain2,无标点)已删
- out-1694570063:微调out-1694536341的模型(–dataset=processed_sft4)已删
- out-1694572707:预训练后的模型(dropout=0.2,dataset=processed_pretrain)已删
- out-1694578477: 微调out-1694572707的模型(–dataset=processed_sft3)已删
- 这个快一点,1.8秒生成,但是很不准确
- out-1694616959:微调out-1694578477的模型(–dataset=processed_sft3,但是用的是增加过后的数据集)已删
- 感觉这个生成速度好慢,大概5.8秒生成答案
- out-1694654891: 微调out-1694572707的模型(–dataset=processed_sft3,数据集有新增)已删
- 这个稍微快一点,但是感觉不太准确,一个问题的答案生成10次可能好多都不太一样
- out-1694661568: 微调out-1694572707的模型(–dataset=processed_sft3,数据集有新增且去除了换行符)已删
- out-1694673396:预训练后的模型(dropout=0.0,dataset=processed_pretrain)已删
- out-1694674345: 微调out-1694673396的模型(–dataset=processed_sft3)已删
- processed_sft: 使用数组的最大长度截断 已删
- out-1694693842: 微调out-1694572707的模型(–dataset=processed_sft)已删
- processed_sft2: 使用block截断,但是给截断的增加了结束符 已更新
- out-1694694276: 微调out-1694572707的模型(–dataset=processed_sft2)已删
忙活了一天,结果输出的全是乱码😥感觉还是预处理出了问题,毕竟预处理生成的模型输出的都是乱码。貌似要去除标点还有一些特殊字符?试试看有没有用
——感谢wyh的提示,改了一下数据读入的格式,统一为np.int64,就能输出中文了(虽然我也不知道它输出的是什么
在prepare.py中这样改,加一个dtype=np.int64:
1 | train_ids = np.array(train_token,dtype=np.int64) |
剩下的明天再写吧
.
2023/9/13
今日大作业进展:
- 将预训练和微调数据集的处理方式变了一下,输出不再是乱码或者有很多感叹号了
- 使用gradio可视化了一下界面
待完成:
- 增加微调数据集√
- 将模型下载到本地再用gradio可视化x(貌似不行
——————————————
今天晚上洋哥来找我聊天,于是走走聊聊聊了一个小时(好累)。其实我更感觉洋哥在向我吐槽工作和学术界哈哈哈哈。最后分别的时候洋哥还塞给了我一大包零食,开心,感觉被全世界爱着。
.
2023/9/14
大作业待解决问题:
- 回答的截断
- 回答中莫名出现其他的问题
- 不知为何,还是会有乱码(√这个暂时用正则表达式解决了)
写第二次大作业的时候,久违的无力感又来了。
sad
.
2023/9/15
大作业待解决问题:
- 回答的截断√(将block_size设置成512然后重新训练
- 回答中莫名出现其他的问题
- 不知为何,还是会有乱码√(用re过滤了一下
- 部分问题生成的回答相关性不高
记录一下现有的模型:
- out-1694746110: 预训练后的模型(dropout=0.2, block_size=512)已删
- out-1694747755: 微调out-1694746110后的模型(–dataset=processed_sft2 –init_from=finetune –ckpt_dir=out-1694746110)已删
- 将block_size设置成512后暂时解决了答案的截断问题。
- 模型的ppl值为6.7558544204798245
- out-1694754761: 微调out-1694746110后的模型(–dataset=processed_sft –init_from=finetune –ckpt_dir=out-1694746110, 微调数据集有更新,lr=1e-3)
- 这个似乎比out-1694747755好一点?主观上,看能不能通过评估指标判断一下吧
- 模型的ppl值为7.575824473155883
- out-1694758307: 微调out-1694746110后的模型(与out-1694754761不同的是将lr设置成1e-5)
- 模型的ppl值为3.0003523436422723
- 暂时加粗这个模型
- …这个输出的答案好烂,问答和小说文章夹杂…已删
- out-1694762393: 微调out-1694746110后的模型(lr=3e-5)
- 模型的ppl值为3.0585097565927213
- 这个也是,看来ppl低不一定好…已删
- processed_pretrain2: 去除了数据集中的空格、全角空格、换行符
- out-1694768459: 预训练后的模型(–dataset=processed_pretrain2, dropout=0.2, block_size=512)
- 比out-1694746110好一点,没有全角空格出现了
mark一下以后有时间可以看的:
使用GPT2的:https://zhuanlan.zhihu.com/p/625791719
使用transformers的:https://tianchi.aliyun.com/forum/post/336319
实验评分标准:
- 预训练模型(15分)
- 训练模型代码正确可运行(5分)√
- 训练损失曲线收敛(5分)√
- 预训练模型能够正常输出内容,即对输入进行补全(5分)√
- 有监督微调模型(13分)
- 微调数据收集(3分)√
- 微调模型正常运行,并且训练损失收敛(5分)√
- 微调模型能够输出正常内容,即回答输入问题(5分)√
- 部署模型与评估模型效果(7分)
- 实现模型在个人电脑上运行,进行可视化界面的对话展示(2分)√
- 评估模型的效果(5分):生成速度√、生成文本有效√、生成质量(流畅√、没有截断√、与问题相关等)
突然意识到evaluations是自己用来评估后写实验报告的,那么接下来的任务:
- 选出效果最好的微调模型(用评估后的数据?但是我还不知道怎么评估)√
- 写实验报告(注意一定要写出自己探索性的尝试!)
- sample.py在哪添加encoding=’utf-8’可以让输出不生成乱码?√
- 预训练模型补全输出会有莫名的空格(也许和任务3有关),然后最后会在一句中突然截断,看能不能改一改√
任务3和4通过用re清洗预训练数据暂时解决了,但是感觉预训练模型输出的截断问题解决不了。
————————————
想了好久好久的evaluations怎么写,结果助教说那个是自己评估的,验收不会用到()
那么剩下的任务:
- 选出最好的微调模型(倒是算出了ppl)√
- 写实验报告(注意一定要写出自己探索性的尝试!)√
- 向即将发出的验收标准靠拢
- 改改预训练输出截断的问题?不过我觉得应该是改不了
.
2023/9/16
今早看了看文刀日肥里的一篇推送,突然看到了嵩嵩的歌词“崩塌的瞬间我还攥着新鲜玫瑰。”然后到图书馆后立刻打开网易云听了《庞贝》。
真的好想去意大利,去看看真正的那不勒斯是不是如书里一般混乱但是富有生命力,看看消逝在尘埃里的庞贝古城。什么时候才能去一趟啊。
————————————
大作业:
- 预训练模型:out-pretrain
- 微调模型:out-sft
明天验收!!!
1.怎样使用gradio:
①看预训练模型的输出:
CUDA_VISIBLE_DEVICES=1 python gr.py
②看微调模型的输出:
CUDA_VISIBLE_DEVICES=1 python gr.py –init_from=finetune
2.怎样用助教给的事例:
1 | CUDA_VISIBLE_DEVICES=1 python sample.py --out_dir=out-sft\ |
——————————————
大作业现状:
至今觉得模型输出的很烂,但是不知道怎么改了也不想改了
别太离谱,怎么第二个大作业写的时间比第一个还多……
希望明晚的验收顺利
.
2023/9/17
要开学了,又得新开一个diary了
看了看暑假刚开始的小计划:
军训过了,小学期也结束了,尽了我最大的努力。
车学完了驾照拿了,托福简单练了一下听力部分
画了几幅画,并且时隔多年再次尝试用ipad画画
钢琴练的不多,但是在家里也会弹弹
搞了近一个月的自媒体,感觉好麻烦,有点想摆烂更新了
和爸妈一起去神农架玩了几天,避暑
然后又和dyj去逛了逛香港澳门珠海广州
听了两场宝贝的十周年演唱会
夏天就这样结束了