有的没的
这几天做专业介绍的 ppt,苦于把 ppt 转为 md。
之前都是用 ppt 保存为 pdf,然后在https://pdf2md.morethan.io/ 转换为 md
今上午试了一下微软的 markitdown 这个 python 库,发现还阔以。直接 markitdown file -o output.md
#programming #ai
之前都是用 ppt 保存为 pdf,然后在https://pdf2md.morethan.io/ 转换为 md
今上午试了一下微软的 markitdown 这个 python 库,发现还阔以。直接 markitdown file -o output.md
#programming #ai
今天实践了手动 rag,提取相关文档的内容加入到 prompt 里面。
pdf 转 md 使用了https://pdf2md.morethan.io/
然后 md 中写明白引用的章节。
一般就是 三个### 加上材料的名字,比如:
引用的时候,使用[文字](#章节名字)来引用,比如
这样,按住cmd再点击就跳转到相应位置了。
可能不这么引用,llm也会自己找到···这么做确实有点麻烦,但是更精确吧。
#programming #ai
pdf 转 md 使用了https://pdf2md.morethan.io/
然后 md 中写明白引用的章节。
一般就是 三个### 加上材料的名字,比如:
### 学院信息
引用的时候,使用[文字](#章节名字)来引用,比如
[学院介绍](#学院信息)
这样,按住cmd再点击就跳转到相应位置了。
可能不这么引用,llm也会自己找到···这么做确实有点麻烦,但是更精确吧。
#programming #ai
查找了一下问题,在 issue 发现了解决方案。
首先推荐使用 0.6.10 这个版本试一下。如果还不行就在容器里执行
find /app/build/_app/immutable/chunks/*.js -exec sed -i -e "s/.split(new RegExp(\"(?<=\[.\!?\])\\\\\\\\s+\"));/.match(\\/\\[^.?\!\]+\[.\!?\]+\[\\\\])'\"\`\’\”\]\*|.+\/g)||\[\];/g" {} \;
#AI #openwebui
Mistral推出新API,将PDF文档转换为AI可用的Markdown文件
Mistral推出了一款新的OCR API,名为Mistral OCR,旨在将复杂的PDF文档转换为文本文件,以便AI模型更轻松地处理。与大多数OCR API不同,Mistral OCR是多模态API,能够检测并处理文本中的插图和照片,生成带有格式化元素的Markdown文件。Mistral称其OCR模型在处理包含数学表达式、复杂布局或表格的文档时表现优于Google、Microsoft和OpenAI的API,且在非英语文档处理上也有优势。
TechCrunch
#ai
Mistral推出了一款新的OCR API,名为Mistral OCR,旨在将复杂的PDF文档转换为文本文件,以便AI模型更轻松地处理。与大多数OCR API不同,Mistral OCR是多模态API,能够检测并处理文本中的插图和照片,生成带有格式化元素的Markdown文件。Mistral称其OCR模型在处理包含数学表达式、复杂布局或表格的文档时表现优于Google、Microsoft和OpenAI的API,且在非英语文档处理上也有优势。
TechCrunch
#ai
Commemoration of paper translation in 2024.
Translate to English:
1. Use claude for the 1st round, largely accept the result but might seek GPT if some obvious translation mistakes are made.
2. Compare the translation with the original paragraphs from the beginning. If abnormality is found, seek translations from gpt
#ai
Translate to English:
1. Use claude for the 1st round, largely accept the result but might seek GPT if some obvious translation mistakes are made.
2. Compare the translation with the original paragraphs from the beginning. If abnormality is found, seek translations from gpt
#ai
写教案的,还得是claude。
探索出来个新路径:
1. 每一门课建立一个新聊天,然后使用以下prompt:
2. 然后附上一个已经做好的或者是空的教案模板文件。
3. ok了
一般是在openwebui里面做,因为用官方claude老是超字数。
也可以试一试给一个完全空的教案模板让他写一下子试试。
update 2024-11-03: 发现notebooklm也很适合做这个
#work #ai
探索出来个新路径:
1. 每一门课建立一个新聊天,然后使用以下prompt:
## role
你是一个机电一体化专业的大学老师,主要负责西门子PLC、hmi的课程。
## insight
1. 平时你研究的主要方面有SCL语言、西门子s7-1200、HMI设备。
2. 现在需要做一个教案,对应一次课,每次课是4节40分钟的课组成,所以总时长160分钟。
3. 这个教案的题目是: tic tac toe游戏的实现。
## statement
- 我会提供一份空的模板文件供参考,你需要围绕以上题目,参考教案里面的元素,将docx里面需要填写的部分填好。
- 上课时间可以不填。
- 教案的重点环节是教学过程设计。请尽可能的丰富教学过程,并且加入足够的目标知识的细节。
## personality
博学、认真、考虑周到
2. 然后附上一个已经做好的或者是空的教案模板文件。
3. ok了
一般是在openwebui里面做,因为用官方claude老是超字数。
也可以试一试给一个完全空的教案模板让他写一下子试试。
update 2024-11-03: 发现notebooklm也很适合做这个
#work #ai